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(54) Titre : B ANQUE GENOMIQUE DU CYANOPHAGE S-2L ET ANALYSE FONCTIONNELLE 

(57) Abstract: The invention relates to the genome sequence and the nucleotide sequences coding for polypeptides of cyanophage 
S-2L. According to the invention, the polypeptides include, but are not limited to, polypeptides involved in the synthesis, transcription 
and replication of purine bases. In particular, determining the genome of cyanophage S-2L is useful for supplying genes which, 
expressed in recombinant bacteria, enable the synthesis of DNA monomers incorporating base D (2,6 diaminopurine) instead of base 
A (adenine), thereby producing chemically-remodelled nucleic acids in the bacteria. 

(57) Abrege : L pr6sente invention a pour objet la sequence genomique et des sequences nucleotidiques codant pour des polypeptides 
du cyanophage S-2L. Les polypeptides decrits dans la presente invention sont, de facon non limitative, des polypeptides impliques 
dans la synthese, la transcription et la replication des bases puriques. En particulier, la determination du genome du cyanophage 
S-2L est un outil utile pour la fourniture de genes, qui exprim£s dans des bacteries recombinantes, permettent la sythese de mono- 
meres d'ADN incorporant la base D (2,6 diaminopurine) au lieu de la base A (adenine) et ainsi de produire des acides nucleiques 
chimiquement remodeles chez les bacteries. 
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Banque g6nomique du cvanophage S-2L et analyse fonctionnelle 



5 La pr6sente invention a pour objet la sequence genomique et des sequences 

nucieotidiques codant pour des polypeptides du cyanophage S-2L. Les polypeptides 
decrits dans la pr6sente invention sont, de fa?on non limitative, des polypeptides 
impliqu6s dans la synthase, la transcription et la replication des bases puriques. En 
particulier, la determination du genome du cyanophage S-2L est un outil utile pour la 

10 fourniture de g£nes, qui exprimes dans des bacteries recombinantes, permettent la 
synthase de monom6res d' ADN incorporant la base D (2,6 diaminopurine) au lieu de 
la base A (adenine) et ainsi de produire des acides nucleiques chimiquement 
remodeies chez les bacteries. 

L'invention concerne egalement Tutilisation de la sequence genomique et/ou 

15 des sequences nucieotidiques et/ou polypeptidiques d6crites dans la presente 
invention pour F analyse de Texpression de gdnes. 

Les deux acides nucleiques principaux ADN et ARN sont des polymferes de 
nucleotides qui sont composes d'une base purine ou pyrimidine liee k un sucre a 5 
carbones (desoxyribose dans Ie cas de l'ADN, ribose dans TARN) par une liaison N- 

20 glycosidique et un phosphate esterifie au groupement hydroxyl du carbone situe k la 
position 5 ! du sucre: ARN et ADN contiennent quatre types de nucleotides qui se 
distinguent par leurs bases : adenine (A), guanine (G), cytosine (C) et uracile (U) 
pour TARN ; le 5-methyluracile, c'est-a-dire la thymine (T), rempla9ant l'uracile dans 
TADN. 

25 Parmi les alterations chimiques de l'ADN et de TARN possibles seules des 

modifications des bases et non du sucre ont ete observees. Contrairement k l'ADN 

aucun ARN modifie n'a pu etre replique k ce jour. 

Des bases modifiees s'observent dans l'ADN de tous les organismes, et peuvent 

etre impliquees dans des phenom&ies de regulation de l'expression genetique (5). 
30 Sauf chez les bacteriophages, les modifications de l'ADN connues jusqu'a. present 

sont produites par des reactions enzymatiques post-r6plicatives, dont un duplex 

d' ADN est le substrat 
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Au contraire, lors de l'infection par certains bacteriophages, les modifications 
de l'ADN connues jusqu'a present sont produites par des reactions enzymatiques pre- 
r6plicatives, dont un nucleotide est le substrat, pour aboutir k un d6soxynucl6oside 
triphosphate non-canonique. Parmi les modifications connues on citera les entit6s : 
5 dUTP, 5-hydroxymethyl-dUTP, 5-dihydroxypentyl-dUTP, 5-hydroxymethyl-dCTP. 
Une autre entite est fortement suspectee : le 5-methyl-dCTP (11). L'emergence des 
bases modifies chez les bacteriophages est generalement interpretee comme une 
contre-mesure aux systdmes de restriction des bacteries (11). 

Quelques exemples de bases modifiees sont representes sur la figure 1 . 

10 Le bromouracile ou la 8-azaguanine sont des analogues synthetiques des bases 

naturelles thymine et guanine. Ces analogues sont convertis en nucleotides tri- 
phosphate par les voies de sauvegarde des purines ou pyrimidines et sont ensuite 
incorpores dans l'ADN. 

La 6-methyladenine et la 5-methylcytosine sont les bases modifiees les plus 

15 frequemment rencontrees. Les nucleotides methyies ne sont pas incorpores en tant 
que tel dans l'ADN mais sont le produit de Taction d ! ADN methyltransferases 
specifiques. Ces en2ymes transffcrent le groupement methyl de la S- 
adenosylmethionine k l'adenine ou la cytosine et ce aprds la replication de l'ADN. 
Chez les procaryotes le r61e principal de la methylation de l'ADN est la degradation 

20 de l'ADN etranger. Chez les eucaryotes la methylation de l'ADN influe sur la 
regulation de l'expression des gdnes et sur la differenciation cellulaire. 

Chez certaines phages de type T comme le bacteriophage T4, la cytosine est 
remplacee systematiquement par la 5-hydroxymethylcytosihe. Cette substitution 
necessite d'xme part une voie de biosynthese de rhydroxymethyldesoxycytidine tri- 

25 phosphate (HM dCTP) ainsi que des enzymes permettant Texclusion de la base 
normale. 

La voie de biosynthdse de THMC DNA fait intervenir xme hydroxym6thylase 
qui convertit le dCMP en hydroxymethyl dCMP, une nucleoside monophosphate 
kinase qui phosphoryle le HM dCMP pour donner le diphosphate, pr6curseur du HM 
30 dCTP qui est ensuite incorpore dans l'ADN polymerase puis glycosyie par une 
glycosyltransferase. 

L'exclusion de la cytosine fait intervenir d'une part des endonucieases 
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spScifiques de l'ADN contenant cette base et une dCDPase-dCTPase qui convertit les 
nucleotides correspondant en dCMP qui est alors substrat de la dCMP 
hydroxym&hylase et de la dCMP deaminase. La dCMP d6saminase g6n£re le 
dUMP pnfcurseur du dTMP. 
5 Par un m6canisme similaire k celui d6crit ci-dessus, la thymine est remplac^e 

par le 5-hydroxym^thyluracile (phages SPOl et <j>e) ou l'uracile (phages PBS2) chez 
plusieurs phages de Bacillus substilis (Warren, 1980 ; Kornberg et Baker, 1991). 

D'autres phages tel SP15 ou <|>W14 ont un ADN dont la thymine a 6t6 
remplacSe par la 5-dihydroxypentyluracile et ra-putrescinylthymine. Cependant, ce 
10 remplacement n'est que partiel et semble etre dfi a des modifications post- 
r6plicatives. 

Dans le cas de S-2L, la voie de synthese de la base D riest pas encore 
parfaitement etablie et la modification post-replicative de l'ad&iine en diamino- 
purine ne peut Stre totalement ecartee. Cependant, la biosynthese du monomere non- 
15 canonique dDTP apparait comme significativement plus vraisemblable, compte tenu 
du fait que le remplacement de A par D dans l'ADN de S-2L est total et non 
majoritaire (7,8), comme c ! est le cas pour les modifications post-replicatives 
d'hydroxym6thyl-U en putrescinyl-T dans le phage <|>W14. De plus, la modification 
de A en D in situ n6cessiterait la rupture des liaisons hydrogdne des duplex d'ADN 
20 et, pouvant difficilement s'effectuer en une seule 6tape chimique, introduirait des 
16sions mutag&nes si ce processus 6tait interrompu. 

Le cvanophage S-2L 

Le cyanophage S-2L a 6t6 isole d'echantillons d'eau preleves dans la region de 

25 Leningrad. Ce phage est capable de lyser un nombre relativement restreint de 
Synechococcus: sp. 698, 58 et PCC6907. D'un point de vue morphologique il se 
compose d'une tSte icosaedrique et dune queue flexible non contractile. S-2L ferait 
partie d'une famille dont Tautre membre pourrait Stre le phage SM-2 qui lui est 
morphologiquement similaire (Fox et coll. 1976). 

30 L'ADN du phage S-2L est lin£aire double brin d'une taille de 42 kb compost de 

70% G:C et de 30% d f une paire 6quivalente k A:T dans laquelle l'ad6nine a 6t6 
remplac6e par la 2,6 diaminopurine (D). Ce remplacement est total et aucune autre 
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base n'apu etre identiftee (Kirnos et coll., 1977 ; Khudyokov et coll., 1978). Comme 
on l'a vu pr6c£demment, seuls des remplacements totaux de bases pyrimidines ont ete 
rapportes, S-2L est jusqu'a ce jour le seul cas pour une base purine. 

Comme dans les paires G:C trois liaisons hydrog&ae sont formees entre la 
5 purine et la pyrimidine de la pake D:T ce qui confere k TADN une plus grande 
stabilite. 

La presence de la base D dans TADN de S-2L entraine une resistance a la 
digestion par les endonuclSases de restriction poss6dant un A dans leur site de 
reconnaissance (l'enzyme de restriction TaqI 6tant la seule exception). Par contre, la 
10 paire D:T semble §tre reconnue cornme une paire G:C par les enzymes de restriction 
clivant les sequences riches en G:C comme Smal (Szekeres et Matveyev, A.V., 
1978). 

Compte tenu du fait que le remplacement de la base A par D est total et non 
majoritaire, il est fort vraisemblable que le genome du phage S-2L code pour au 
15 moins une voie de biosynthese de la base D. 

Au vu de Tart ant&ieur, F6tude du cyanophage S-2L demande de nouvelles 
approches, en particulier genetiques, afin d'ameliorer la comprehension des 
differentes voies m&aboliques de cet organisme. 

Ainsi, un objet de la prtSsente invention est de divulguer la sequence complete 
20 du genome du cyanophage S-2L et de tous les gfenes contenus dans cedit genome. 

En effet, la connaissance du genome de cet organisme permet de mieux definir 
les interactions entre les differents g6nes, les differentes proteines, et par la-mSme, 
les differentes voies metaboliques. En effet, et contrairement k la divulgation de 
sequences isol£es, la sequence genomique complete d'un organisme forme un tout, 
25 permettant d'obtenir imm^diatement toutes les informations nScessaires k cet 
organisme pour croitre et fonctionner. 

L'invention vise en particuher a sequencer le genome du phage S-2L, de 
mantere k obtenir un gisement de gdnes qui, une fois propag6s isotement et exprimSs 
sous contrSle dans des bact6ries recombinantes, sont destin6s notamment k former 
30 par voie biotechnologique de nouveaux monomdres de TADN et k produire, voir 
r^pliquer, des acides nucl6iques chimiquement remodetes chez les bact6ries. 

L'invention vise 6galement k utihser des sequences nucteotidiques obtenues 
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pour Tidentification des voies m6taboliques conduisant k la production des bases D. 

L'invention vise egalement k la production enzymatique d' analogues de 
d6soxynucl6osides trds utiles notamment dans la chimiotherapie du SID A. 

L'invention vise egalement k exprimer chez un h6te du cyanophage S2L des 
5 acides nucieiques codant pour des prolines impliqu6es dans le metabolisme des 
bases D. 

Ainsi Tinvention vise Egalement a obtenir des g&nes de S-2L qui propag6s 
individuellement chez E.coli et exprimSs sous strict contr61e transcriptionnel 
permettront de tester les hypotheses concernant leur fonction dans le metabolisme 
1 0 des nucleotides, la replication et la transcription. 

Pour atteindre les diflKrents r^sultats techniques recherches, l'invention concerne 
selon un premier aspect une sequence nucleotidique du cyanophage S-2L 
correspondant k SEQ ID N° 1 . 

La presente invention concerne egalement une sequence nucleotidique du 
15 cyanophage S-2L choisie parmi : 

a) une sequence nucleotidique comportant au moins 80 %, 85 %, 90 %, 95 
% ou 98 % d'identite avec SEQ ID N° 1 ; 

b) une sequence nucleotidique hybridant dans des conditions de forte 
stringence avec SEQ ID N° 1 ; 

20 c) une sequence nucleotidique compiementaire de SEQ ID 

N° 1 ou compiementaire d'une sequence nucleotidique telle que definie 
en a), ou b), ou une sequence nucleotidique de l'ARN correspondant ; 

d) une sequence nucleotidique de fragment representatif de SEQ IDN° 1, 
ou de fragment representatif d'une sequence nucleotidique telle que 

2 5 definie en a), b) ou c); 

e) une sequence nucleotidique comprenant une sequence telle que definie en 
a), b), c) ou d) ; et 

f) une sequence nucleotidique modifiee d'une sequence nucleotidique telle 
que definie en a), b), c), d) ou e). 

30 De fa$on plus particuli&re, la presente invention a egalement pour objet les 

sequences nucieotidiques caracterisees en ce qu'elles sont issues de SEQ ID N° 1 et 
en ce qu'elles codent pour des polypeptides choisis parmi les sequences SEQ ID N° 2 
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a SEQ ED N° 527 ou un fragment biologiquement actif de ces polypeptides. 

De plus, Tinvention concerne egalement les sequences nucieotidiques 
caracteris6es en ce qu'elles comprennent une sequence nucleotidique choisie parmi : 

a) une sequence nucleotidique issue de SEQ ID N° 1 et codant pour un 
5 polypeptide choisi parmi les sequences parmi SEQ ID N° 2 k SEQ ID N° 

527. 

b) une sequence nucleotidique comportant au moins 80 %, 85 %, 90 %, 95 % 
ou 98 % d'identite avec une sequence nucleotidique selon a) ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte 
10 stringence avec une sequence nucleotidique selon a) ou b); 

d) une sequence nucleotidique cotnpiementaire ou d'ARN correspondant k 
une sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique de fragment representatif d'une sequence telle 
que definie en a), b), c) ou d) ; et 

15 f) une sequence nucleotidique modifiee d'une sequence telle que definie en 

a),b),c),d)oue), 

De preference l'invention concerne une sequence nucleotidique caracterisee en ce 
qu'elle code pour un polypeptide choisi parmi : 
20 a) les polypeptides du cyanophage S-2L de sequences SEQ ID N°2 k SEQ ID 

N°527 ; 

b) de preference les 54 polypeptides mentionnes sur le tableau 1 k savoir: SEQ 
roN o 14a8^6,68,86,92 9 105,109,134,142,143,148,152,169 3 175 3 187, 208,211,234,246, 
250,257^64,286,298,316,332,342,347,348,351,355,364,365,369,370,392,395, 406, 

25 418,422,425,429,432,433,454,464,466,472,484,489,494,500; 

c) de preference encore les 14 polypeptides du cyanophage S-2L indiqu6s sur le 
tableau 1 comme pr6sentant une homologie significative k savoir les sequences SEQ ID 
N° 86,92,152,175,234,257,298,316,395,406,425,484 ; 

d) les polypeptides pr£sentant au moins 80 % de preference 85 %, 90 %, 95 % 
30 et 98 % d'identite avec un polypeptide de a), b) ,c) ; 

e) les fragments biologiquement actifs des polypeptides de a), b), c), d) 

f) les polypeptides modifies de a),b),c),d),e). 
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L' invention conceme egalement une sequence nucleotidique caract6ris6e en ce 
qu'elle comprend une sequence nucleotidique choisie parmi : 

a) une sequence nucleotidique telle que definie ci-dessus ; 

b) une sequence nucleotidique comportant au moins 80 % d'identite avec 
5 une sequence nucleotidique de a) ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte 
stringence avec une sequence nucleotidique de a) ou b) ; 

d) une sequence nucleotidique compiementaire ou d'ARN correspondant k 
une sequence telle que definie en a), b) ou c) ; 

10 e) une sequence nucleotidique de fragment representatif d'une sequence 

telle que definie en a), b), c) ou d) ; et 
f) une sequence nucleotidique modifiee d'une sequence telle que definie en 
a), b), c), d) ou e). 

Par acide nucieique, sequence nucieique ou d' acide nucieique, polynucleotide, 

15 oligonucleotide, sequence de polynucleotide, sequence nucleotidique, termes qui seront 
employes indifferemment dans la presente description, on entend designer un 
enchainement precis de nucleotides, modifies ou non, pennettant de definir un 
fragment ou une region d'un acide nucieique, comportant ou non des nucleotides non 
naturels, et pouvant correspondre aussi bien a un ADN double brin, un ADN simple 

20 brin que des produits de transcription desdits ADNs. Ainsi, les sequences nucieiques 
selon Tinvention englobent egalement les PNA (Peptid Nucleic Acid), ou analogues. 

II doit etre compris que la presente invention ne conceme pas les sequences 
nucieotidiques dans leur environnement chromosomique naturel, c'est-&-dire k l'etat 
naturel. II s'agit de sequences qui ont ete isoiees et/ou purifiees, c'est-a-dire qu'elles 

25 ont ete preievees directement ou indirectement, par exemple par copie, leur 
environnement ayant ete au moins partiellement modifie. On entend ainsi egalement 
designer les acides nucieiques obtenus par synthese chimique. 

Par « pourcentage d'identite » entre deux sequences d 5 acides nucieiques ou 
d 5 acides amines au sens de la presente invention, on entend designer un pourcentage de 

30 nucleotides ou de residus d'acides amines identiques entre les deux sequences k 
comparer, obtenu apr&s le meilleur alignement, ce pourcentage etant purement 
statistique et les differences entre les deux sequences etant reparties au hasard et sur 
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toute leur longueur. On entend designer par "meilleur alignement" ou "alignement 
optimal", l'alignement pour lequel le pourcentage d'identite determine comme ci-apres 
est le plus eleve. Les comparaisons de sequences entre deux sequences d'acides 
nucleiques ou d'acides amines sont traditionnellement r6alisees en comparant ces 
5 sequences aprfes les avoir alignees de manure optimale, ladite comparaison etant 
r6alis6e par segment ou par « fen&re de comparaison » pour identifier et comparer les 
regions locales de similarite de sequence. L'alignement optimal des sequences pour la 
comparaison peut Stre realist, outre manuellement, au moyen de I'algorithme 
d'homologie locale de Smith et Waterman (1981, Ad. App. Math. 2 : 482), au moyen 

10 de I'algorithme d'homologie locale de Neddleman et Wunsch (1970, J. Mol. Biol. 48 : 
443), au moyen de la methode de recherche de similarity de Pearson et Lipman (1988, 
Proc. Natl. Acad. Sci. USA 85 : 2444), au moyen de logiciels informatiques utilisant 
ces algorithmes (GAP, BESTFIT, BLAST P, BLAST N, FASTA et TFASTA dans le 
Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., 

15 Madison, WI). Afin d'obtenir l'alignement optimal, on utilise de preference le 
programme BLAST, avec la matrice BLOSUM 62. On peut egalement utiliser les 
matrices PAM ou PAM250. 

Le pourcentage d'identite entre deux sequences d'acides nucleiques ou d'acides 
amines est determine en comparant ces deux sequences alignees de maniere optimale 

20 dans laquelle la sequence d'acides nucleiques ou d'acides amines k comparer peut 
comprendre des additions ou des deletions par rapport k la sequence de reference pour 
un alignement optimal entre ces deux sequences. Le pourcentage d'identite est calcule 
en determinant le nombre de positions identiques pour lesquelles le nucleotide ou le 
rdsidu d'acide amine est identique entre les deux sequences, en divisant ce nombre de 

25 positions identiques par le nombre total de positions comparees et en multipliant le 
r£sultat obtenu par 100 pour obtenir le pourcentage d'identite entre ces deux sequences. 

Par sequences nucleiques presentant un pourcentage d'identite d'au moins 80 %, 
de preference 85 % ou 90 %, de fa9on plus preferee 95 % voire 98 %, apres alignement 
optimal avec une sequence de reference, on entend designer les sequences nucleiques 

30 presentant, par rapport k la sequence nucieique de reference, certaines modifications 
comme en particulier une deletion, une troncation, un allongement, une fusion 
chimerique et/ou une substitution, notamment ponctuelle, et dont la sequence nucieique 
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pr&ente au moios 80 %, de preference 85 %, 90 %, 95 % ou 98 %, d'identite apres 
alignement optimal avec la sequence nucleique de reference. II s'agit de preference de 
sequences dont les sequences compiementaires sont susceptibles de s'hybrider 
specifiquement avec les sequences de reference. De preference, les conditions 
5 d'hybridation sp^cifiques ou de forte stringence seront telles qu'elles assurent au moins 
80 %, de preference 85 %, 90 %, 95 % ou 98 % d'identite apr£s alignement optimal 
entre Tune des deux sequences et la sequence compiementaire de 1' autre. 

Une hybridation dans des conditions de forte stringence signifie que les 
conditions de temperature et de force ionique sont choisies de telle mantere qu'elles 
10 pennettent le maintien de l'hybridation entre deux fragments d'ADN compiementaires. 
A titre illustratif, des conditions de forte stringence de 1'etape d'hybridation aux fins de 
definir les fragments polynucieotidiques decrits ci-dessus, sont avantageusement les 
suivantes. 

L'hybridation ADN-ADN ou ADN-AKN est realisee en deux etapes : (1) 

15 prehybridation a 42°C pendant 3 heures en tampon phosphate (20 mM, pH 7,5) 
contenant 5 x SSC (1 x SSC correspond a une solution 0,15 M NaCl + 0,015 M citrate 
de sodium), 50 % de formaxnide, 7 % de sodium dodecyl sulfate (SDS), 10 x 
Denhardfs, 5 % de dextran sulfate et 1 % d f ADN de sperme de saumon ; (2) 
hybridation proprement dite pendant 20 heures k une temperature dependant de la taille 

20 de la sonde (i.e. : 42°C, pour vine sonde de taille > 100 nucleotides) suivie de 2 lavages 
de 20 minutes a 20°C en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes a 20°C en 0,1 x 
SSC + 0,1 % SDS. Le dernier lavage est pmtique en 0,1 x SSC + 0,1 % SDS pendant 
30 minutes k 60°C pour une sonde de taille > 100 nucleotides. Les conditions 
d'hybridation de forte stringence decrites ci-dessus pour un polynucleotide de taille 

25 definie, peuvent etre adaptees par l'homme du metier pour des oligonucleotides de 
taille plus grande ou plus petite, selon l'enseignement de Sambrook et al., (1989, 
Molecular cloning : a laboratory manual. 2 nd Ed. Cold Spring Harbor). 

De plus, par fragment representatif de sequences selon 1' invention, on entend 
designer tout fragment nucieotidique pr6sentant au moins 15 nucleotides, de 

30 preference au moins 20, 30, 75, 150, 300 et 450 nucleotides consecutifs de la 
sequence dont il est issu. On entend en particulier une sequence nucleique codant 
pour un fragment biologiquement actif d'un polypeptide, tel que defini plus loin, 
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notamment d'un polypeptide de sequence SEQ ID N°2 a 527. 

Par fragment representatif, on entend egalement les sequences intergeniques, et 
en particulier les sequences nucleotidiques portant les signaux de regulation 
(promoteurs, terminateurs, voire enhancers. . .). 
5 Parmi lesdits fragments representatifs, on pref&re ceux ayant des sequences 

nucleotidiques correspondant k des cadres ouverts de lecture, denomm6s sequences 
ORFs (ORF pour « Open Reading Frame »), compris en general entre un codon 
d'initiation et un codon stop, ou entre deux codons stop, et codant pour des 
polypeptides, de preference d'au moins 30 acides amines, tel que par exemple, sans 

10 s'y limiter, les sequences ORFs qui seront decrites par la suite. 

La numirotation des sequences nucleotidiques ORFs qui sera utilisee par la 
suite dans la presente description correspond a la numerotation des sequences 
d' acides amines des proteines codees par lesdites ORFs. 

Ainsi, les sequences nucleotidiques ORF2, ORF3..., ORF526 et ORF527 

15 codent respectivement pour les proteines de sequences d' acides amines SEQ ID N° 2, 
SEQ ID N° 3..., SEQ ID N° 526 et SEQ ID N° 527 figurant dans la liste de 
sequences de la presente invention. Les sequences nucleotidiques detainees des 
sequences ORF2, ORF3..., ORF526 et ORF527 sont determinees par leur position 
respective sur la sequence genomique SEQ ID N° 1 du cyanophage S2L. Le tableau 1 

20 fournit les coordonnees de 54 ORFs prefe^es par rapport k la sequence nucieotidique 
SEQ ID N° 1, en donnant le nucleotide de depart, le nucleotide de fin d'ORF, et le 
cadre de lecture +1,2,3 ou -1,2,3 tel qu'explique ci-apres. Le listing des sequences 
indique pour chacune des 526 ORF identifiees, numerotees ORF2 a ORF527, le 
cadre de lecture. Pour une parfaite concordance des numerotations des ORF et des 

25 SEQ ID dans le listing de sequence, on a choisi de faire debuter les ORF au numero 2 
(il n'y a done pas d'ORF 1). II est entendu que la sequence SEQ ID N°l est un brin 
ADN dans P orientation 5'-3\ la sequence SEQ ID N°2 est une sequence proteique 
codee par l'ORF N°2. Un cadre « positif » de +1 correspond au cadre de lecture 
designe +1 commen9ant au nucleotide nt 3 de la SEQ ID N°l codon de l'ORF2 

30 situe sur ce cadre de lecture et commen9ant au nt 9 de SEQ ID N°l : TCG qui 
correspond k la serine S ; 2**° codon de l'ORF 2 selon ce cadre : GAG qui 
correspond k Tacide glutamique E). Un cadre +2 correspond au cadre de lecture 
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d6sign6 +2 et commen9ant au nucleotide nt 1 de la SEQ ID N°l (1 CT codon de l'ORF 

4 situe sur ce cadre de lecture et commenfant au nt 10 de SEQ ID N°l : CGG qui 
correspond k Farginine R ; 2* me codon de l'ORF 4 selon ce cadre : AGG qui 
correspond k 1'arginine R). Un cadre +3 correspond au cadre de lecture design^ 4-3 

5 commen9ant au nucleotide nt 2 de la SEQ ID N°l (F r codon de l'ORF 5 situS sur ce 
cadre de lecture et commen9ant au nt35 de SEQ ID N°l : CGT qui correspond a 
rarginine R ; 2 6me codon de PORF 5 selon ce cadre : TCA qui correspond a la serine 
S). 

Ainsi TORF 2 commence au nt n°9 de SEQ ID n°l (c'est a dire la base T) et 
10 s'arrdte au nt n°515 (c'est a dire la base G). L'ORF 4 commence au nt n°10 de SEQ 
ID n°l (c'est a dire la base T) et s'arrete au nt n°342 (c'est a dire la base G). L'ORF 

5 commence au nt n°35 de SEQ ID n°l (c'est a dire la base C) et s'arrete au nt n°280 
(c'est a dire la base A). 

A 1 'inverse, un cadre negatif correspond au brin complementaire antiparallele 
15 du brin positif. Par exemple pour une sequence ATG sur le brin positif dans le sens 
5 '-3', la sequence sur le brin complementaire TAC se lira CAT. Par exemple pour 
l'ORF 3 (nt 9 k nt 791), le brin complementaire des nucleotides 782 a 791 (cct cga 
tag) est (gga gct atc) se lisant dans le sens negatif CTA TCG AGG qui 
correspondent respectivement aux acides amines L, S, R. 
20 Les fragments representatifs selon l'invention peuvent etre obtenus par 

exemple par amplification specifique telle que la PCR ou apres digestion par des 
enzymes de restriction appropries de sequences nucleotidiques selon l'invention, 
cette methode etant decrite en particulier dans l'ouvrage de Sambrook et al.. Lesdits 
fragments representatifs peuvent egalement etre obtenus par synthase chimique 
25 lorsque leur taille n'est pas trop importante, selon des m6thodes bien connues de 
l'homme du metier. 

Parmi les sequences contenant des sequences de l'invention, ou des fragments 
repr6sentatifs, on entend Egalement les sequences qui sont naturellement encadrees 
par des sequences qui pr6sentent au moins 80 %, 85 %, 90 %, 95 % ou 98 % 
30 d'identit6 avec les sequences selon l'invention. 

Par sequence nucteotidique modiftee, on entend toute sequence nucl&rtidique 
obtenue par mutagen&se selon des techniques bien connues de l'homme du metier, et 
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comportant des modifications par rapport aux sequences nonnales, par exemple des 
mutations dans les sequences regulatrices et/ou promotrices de l'expression du 
polypeptide, notamment conduisant a une modification du taux d' expression ou de 
l'activite dudit polypeptide. 
5 Par sequence nucleotidique modifiee, on entend egalement toute sequence 

nucleotidique codant pour un polypeptide modifie tel que defini ci-apr£s. 

La presente invention fournit toutes les sequences nucieotidiques et 
polypeptidiques du genome du cyanophage S-2L. Par ailleurs, il est un objet de la 
presente invention que de divulguer les fonctions de ces gdnes et proteines. 

10 Les genes decrits dans Tinvention ont 6t6 isotes sur des fragments d'ADN gr&ce 

k des amorces deduites de la sequence du cyanophage S-2L. 

De maniere preferee, P invention est relative k une sequence nucleotidique 
caracterisee en ce qu'elle code pour un polypeptide de cyanophage S-2L ou un de ses 
fragments representatifs implique dans le metabolisme des nucleotides, des purines, 

15 des pyrimidines ou nucleosides. Dans ce texte, le terme « fragment reprSsentatif » 
pour un peptide signifie un fragment biologiquement actif de ce peptide (ayant une 
activity d'au moins 10, 20, 50, 100% de l'activite obtenue avec ce peptide). 

En particulier P invention est relative k une sequence nucleotidique caracterisee 
en ce qu'elle code pour un polypeptide de cyanophage S-2L ou un de ses fragments 

20 representatifs implique dans le metabolisme des nucleotides bases D, notamment un 
peptide de sequence SEQ ID N° 175 ou un des ses fragements representatifs. 

De maniere preferee, P invention est relative a une sequence nucleotidique 
caracterisee en ce qu'elle code pour un polypeptide de cyanophage S-2L ou un de ses 
fragments representatifs implique dans le processus de replication, notamment un 

25 peptide de sequence SEQ ID N°14,l 8,142,355,429,454 ou un de leurs fragments 
representatifs. 

De maniere preferee, P invention est relative k une sequence nucleotidique 
caracterisee en ce qu'elle code pour un polypeptide d'enveloppe, notamment de 
capside, de cyanophage S-2L ou un de ses fragments representatifs, notamment un 
30 peptide de sequence SEQ ID N°169,316,351,392,395,406,422,425 ou un de leurs 
fragments representatifs. 
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De mantere pref6r6e, Tinvention est relative k une sequence nucl£otidique 
selon Finvention caract^risde en ce qu'elle code pour un polypeptide de cyanophage 
S-2L ou un de ses fragments implique dans le le detournement de la machinerie 
cellulaire. 

5 De manure pr6f6r6e, Pinvention est relative k une sequence nucieotidique 

selon Tinvention caracterisee en ce qu'elle code pour un polypeptide de cyanophage 
S-2L ou un de ses fragments representatifs implique dans le processus de 
transcription, notamment un peptide de sequence SEQ ID N°92,143,l 87,234 ou un 
de leurs fragments representatifs. 
10 De manure pr&f£r6e, Tinvention est relative a une sequence nucieotidique 

selon Tinvention caracterisee en ce qu'elle code pour un polypeptide de cyanophage 
S-2L ou un de ses fragments representatifs implique dans le processus de virulence 
virale, notamment un peptide de sequence SEQ ID N° 257 ou un fragment 
repr&entatif. 

15 De manfere prefer^e, Tinvention est relative a une sequence nucieotidique 

selon Tinvention caracterisee en ce qu'elle code pour un polypeptide de cyanophage 
S-2L ou un de ses fragments representatifs implique dans les fonctions relatives aux 
transposons notamment un peptide de sequence SEQ ID N°208 ou un de ses 
fragments representatifs. 

20 Les fragments representatifs de sequences nucieotidiques selon Tinvention 

peuvent egalement etre des sondes ou amorces, qui peuvent etre utilisees dans des 
precedes de detection, d'identification, de dosage ou d'amplification de sequences 
nucieiques. 

Une sonde ou amorce se d6finit, au sens de Tinvention, comme etant un 
25 fragment d'acides nucieiques simple brin ou un fragment double brin denature 
comprenant par exemple de 12 bases k quelques kb, notamment de 15 k quelques 
centaines de bases, de preference de 15 k 50 ou 100 bases, et possedant une 
specificity d'hybridation dans des conditions determines pour former un complexe 
d'hybridation avec un acide nucieique cible. 
30 Les sondes et amorces selon Tinvention peuvent Stre marquees directement ou 

indirectement par un compose radioactif ou non radioactif par des mdthodes bien 
connues de Thomme du metier, afin d'obtenir un signal detectable et/ou quantifiable. 
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Les sequences de polynucleotides selon V invention non marqu6es peuvent Stre 
utilises directement comme sonde ou amorce. 

Les sequences sont g6n6ralement marquees pour obtenir des s6quences utilisables 
pour de nombreuses applications. Le marquage des amorces ou des sondes selon 
5 l'invention est realise par des 616ments radioactifs ou par des molecules non 
radioactives. 

Parmi les isotopes radioactifs utilises, on peut citer le 32 P, le 33 P, le 35 S, le 3 H ou le 
125 I. Les entitSs non radioactives sont s61ectionn6es parmi les ligands tels la biotine, 
l'avidine, la stxeptavidine, la dioxyg6nine, les haptenes, les colorants, les agents 

10 luminescents tels que les agents radioluminescents, ch£moluminescents, 
bioluminescents, fluorescents, phosphorescents. 

Les polynucleotides selon P invention peuvent ainsi 6tre utilises comme amorce 
et/ou sonde dans des procedes mettant en oeuvre notamment la technique de PCR 
(amplification en chaine par polymerase) (Rolfs et aL, 1991, Berlin : Springer- Verlag). 

15 Cette technique n^cessite le choix de paires d' amorces oligonucleotidiques encadrant le 
fragment qui doit Stre amplifte. On peut, par exemple, se rSferer a la technique d6crite 
dans le brevet americain U.S. N° 4,683,202. Les fragments amplifies peuvent 6tre 
identifies, par exemple apres une electrophorese en . gel d'agarose ou de 
polyacrylamide, ou aprds une technique chromatographique comme la filtration sur gel 

20 ou la chromatographic 6changeuse d'ions, puis sequences. La sp^cificite de 
1' amplification peut Stre controlee en utilisant comme amorce les sequences 
nucl6otidiques de polynucleotides de l'invention comme matrice, des plasmides 
contenant ces sequences ou encore les produits d' amplification derives. Les fragments 
nucl6otidiques amplifies peuvent etre utilises comme r6actifs dans des reactions 

25 d'hybridation afin de mettre en evidence la presence, dans un 6chantillon biologique, 
d'un acide nucteique cible de sequence complementaire k celle desdits fragments 
nucleotidiques amplifies. 

L'invention vise 6galement les acides nucleiques susceptibles d'etre obtenus par 
amplification k Paide d' amorces selon l'invention. 

30 D'autres techniques d'amplification de l'acide nucteique cible peuvent 6tre 

avantageusement employees comme alternative a la PCR (PCR-like) k l'aide de couple 
d'amorces de sequences nucleotidiques selon l'invention. Par PCR-like on entend 
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designer toutes les m^thodes mettant en oeuvre des reproductions directes ou indirectes 
des sequences d'acides nucleiques, ou bien dans lesqueUes les systemes de marquage 
ont 6t6 amplifies, ces techniques sont bien entendu connues, en g&i6ral il s'agit de 
T amplification de PADN par une polymerase ; lorsque l'6chantillon d'origine est un 
5 ARN il convient pr6alablement d'effectuer une transcription reverse. II existe 
actuellement de irbs nombreux proced&s permettant cette amplification, comme par 
exemple la technique SDA (Strand Displacement Amplification) ou technique 
d' amplification & displacement de brin (Walker et al., 1992, Nucleic Acids Res. 20 : 
1691), la technique TAS (Transcription-based Amplification System) decrite par Kwoh 

10 et al. (1989, Proc. Natl. Acad. Sci. USA, 86, 1173), la technique 3SR (Self-Sustained 
Sequence Replication) decrite par Guatelli et al. (1990, Proc. Natl. Acad. Sci. USA 87: 
1874), la technique NASBA (Nucleic Acid Sequence Based Amplification) decrite par 
Kievitis et al. (1991, J. Virol. Methods, 35, 273), la technique TMA (Transcription 
Mediated Amplification), la technique LCR (Ligase Chain Reaction) decrite par 

15 Landegren et al. (1988, Science 241, 1077), la technique de RCR (Repair Chain 
Reaction) decrite par Segev (1992, Kessler C. Springer Verlag, Berlin, New-York, 197- 
205), la technique CPR (Cycling Probe Reaction) decrite par Duck et al. (1990, 
Biotechniques, 9, 142), la technique d'amplification a la Q-b6ta-rdplicase decrite par 
Miele et al. (1983, J. Mol. Biol., 171, 281). Certaines de ces techniques ont depuis ete 

2 0 perfectionn6es . 

Dans le cas ou le polynucleotide cible k detecter est un ARNm, on utilise 
avantageusement, prealablement a la mise en oeuvre d'une reaction d'amplification a 
i'aide des amorces selon rinvention ou a la mise en oeuvre d'un procede de d6tection a 
Taide des sondes de l'invention, une enzyme de type transcriptase inverse afin 

25 d'obtenir un ADNc a partir de PARNm contenu dans Techantillon biologique. 
L'ADNc obtenu servira alors de cible pour les amorces ou les sondes mises en oeuvre 
dans le proc6d6 d'amplification ou de detection selon rinvention. 

La technique d'hybridation de sondes peut dtre r6alis£e de mani&res diverses 
(Matthews et al., 1988, Anal. Biochem., 169, 1-25). La mSthode la plus g6n<5rale 

30 consiste k immobiliser Pacide nucl&que extrait des cellules de difiKrents tissus ou de 
cellules en culture sur un support (tels que la nitrocellulose, le nylon, le polystyrene) et 
k incuber, dans des conditions bien d6finies, Pacide nucl6ique cible immobilis6 avec la 
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sonde. Apr&s l'hybridation, Pexces de sonde est 61imine et les molecules hybrides 
formees sont detectees par une methode appropride (mesure de la radioactivity de la 
fluorescence ou de l'activite enzymatique li6e a la sonde). 

Selon tin autre mode de mise en oeuvre des sondes nucieiques selon l'invention, 
5 ces demises peuvent Stre utilisees comme sondes de capture. Dans ce cas, une sonde, 
dite « sonde de capture », est immobilisee sur un support et sert a capturer par 
hybridation specifique l'acide nucieique cible obtenu a partir de l'echantillon 
biologique k tester et l'acide nucieique cible est ensuite detecte grSce a une seconde 
sonde, dite « sonde de detection », marquee par un element facilement detectable. 

10 Panni les fragments d'acides nucieiques interessants, il faut ainsi citer en 

particulier les oligonucleotides anti-sens, c'est-&-dire dont la structure assure, par 
hybridation avec la sequence cible, une inhibition de T expression du produit 
correspondant II faut egalement citer les oligonucleotides sens qui, par interaction avec 
des proteines impliquees dans la regulation de l'expression du produit correspondant, 

1 5 induiront soit une inhibition, soit une activation de cette expression. 

De fa?on prefer6e, les sondes ou amorces selon Pinvention sont immobilis£es 
sur un support, de maniere covalente ou non covalente. En particulier, le support peut 
etre une puce a ADN ou un filtre a haute densite, egalement objets de la pr^sente 
invention. 

20 On entend designer par puce a ADN ou filtre haute density, un support sur 

lequel sont fix^es des sequences d'ADN, chacune d'entre elles pouvant etre reper6e 
par sa localisation geographique. Ces puces ou filtres different principalement par 
leur taille, le materiau du support, et eventueilement le nombre de sequences d 5 ADN 
qui y sont fix£es. 

25 On peut fixer les sondes ou amorces selon la presente invention sur des 

supports solides, en particulier les puces a ADN, par differents precedes de 
fabrication. En particulier, on peut effectuer une synthese in situ par adressage 
photochimique ou par jet d'encre. D'autres techniques consistent k effectuer une 
synthase ex situ et k fixer les sondes sur le support de la puce k ADN par adressage 

30 m6canique, eiectronique ou par jet d'encre. Ces differents precedes sont connus de 
Thomme du metier. 

Une sequence nucieotidique (sonde ou amorce) selon 1* invention permet done 
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la detection et/ou r amplification de sequences nucieiques sp6cifiques. En particulier, 
la detection de cesdites sequences est facility lorsque la sonde est fixde sur une puce 
k ADN, ouaun filtre haute densite. 

L'utilisation de puces k ADN ou de filtres k haute density permet en effet de 
5 determiner 1' expression de genes dans un organisme pr£sentant une sequence 
g6nomique proche du cyanophage S-2L. 

La sequence g^nomique du cyanophage S-2L, completee par V identification de 
tous les genes de cet organisme, telle que presentee dans la pr£sente invention, sert de 
base k la construction de ces puces a ADN ou filtre. 

10 La preparation de ces filtres ou puces consiste k synth&iser des oligonucleotides, 

correspondant aux extr6mit6s 5' et 3' des g&nes. Ces oligonucleotides sont choisis en 
utilisant la sequence g6nomique et ses annotations divulguees par la presente invention. 
La temperature d'appariement des ces oligonucleotides aux places correspondantes sur 
T ADN doit etre approximativement la mSme pour chaque oligonucleotide. Ceci permet 

15 de preparer des fragments d'ADN correspondants k chaque gene par l'utilisation de 
condition de PCR appropriees dans un environnement hautement automatise. Les 
fragments amplifies sont ensuite immobilises sur des filtres ou des supports en verre, 
silicium ou polymeres synthetiques et ces milieux sont utilises pour l'hybridation. 

La disponibiUte de tels filtres et/ou puces et de la sequence genomique 

20 correspondante annotee permet d ! etudier l'expression de grands ensembles, voire de la 
totalite des genes dans des virus proches du cyanophage S-2L, en preparant les ADN 
compiementaires, et en les hybridant a 1'ADN ou aux oligonucleotides immobilises sur 
les filtres ou les puces. Egalement, les filtres et/ou les puces permettent d'etudier la 
variabilite des souches en preparant l'ADN de ces virus et en les hybridant a 1'ADN ou 

2 5 aux oligonucleotides immobilises sur les filtres ou les puces. 

Les differences entre les sequences genomiques des differentes souches ou 
espdces peuvent grandement affecter Tintensite de l'hybridation et, par consequent, 
perturber Interpretation des resultats. II peut done etre necessaire d'avoir la sequence 
precise des g£nes de la souche que Ton souhaite etudier. 

30 L'utilisation des filtres k haute densite et/ou des puces permet d'obtenir des 

connaissances nouvelles sur la regulation des g£nes dans les organismes d'importance 
industrielle, et en particulier les bacteries recombinantes incorporant des g£nes du 
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cyanophage S-2L propag6es dans diverses conditions. Elle permet aussi une 
identification rapide des differences entre les genomes des souches utilisees dans de 
multiples applications industrielles. 

Par ailleurs, les puces a ADN ou les filtres selon Pinvention, contenant des 
5 sondes ou amorces specifiques du cyanophage S-2L, sont des elements txbs 
avantageux de kits ou necessaires pour la detection et/ou la quantification de 
Fexpression de genes du cyanophage S-2L dans des bacteries recombinantes 
integrant ces g£nes. 

En effet, le controle de 1'expression des g&nes est un point critique pour les voies 

10 m&aboliques du cyanophage S-2L, soit en permettant P expression d 5 un ou plusieurs 
genes nouveaux, soit en modifiant 1'expression de genes deja presents dans la cellule. 
La presente invention fournit l'ensemble des sequences naturellement actives chez le 
cyanophage S-2L permettant 1'expression des genes. Elle permet ainsi la determination 
de l'ensemble des sequences exprimees chez le cyanophage S-2L. Elle fournit 

15 dgalement un outil permettant de rep&er les genes dont Fexpression suit un schema 
donn6. Pour realiser cela, P ADN de tout ou partie des genes du cyanophage S-2L pent 
etre amplifie grace a des amorces selon l'invention, puis fixe a un support comme par 
exemple le verre ou le nylon ou une puce a ADN, afin de construire un outil permettant 
de suivre le profil d'expression de ces genes. Cet outil, constitue de ce support 

20 contenant les sequences codantes sert de matrice d'hybridation a un melange de 
molecules marquees refietant les ARN messagers exprimes dans la cellule (en 
particulier les sondes marquees selon l'invention). En r^tant cette experience a 
differents instants et en combinant l'ensemble de ces donn^es par un traitement 
approprie, on obtient alors les profits d'expression de l'ensemble de ces genes. La 

25 connaissance des sequences qui suivent un schema de regulation donnee peut aussi Stre 
mise a profit pour rechercher de maniere dirigee, par exemple par homologie, d'autres 
sequences suivant globalement, mais de maniere tegerement difKrente le meme 
schema de regulation. En complement, il est possible d'isoler chaque sequence de 
contrSle presente en amont des segments servant de sondes et d'en suivre l'activite k 

30 l'aide de moyen approprie comme un gene raporteur (luciferase, p-galactosidase, GFP). 
Ces sequences isoiees peuvent ensuite 6tre modifiees et assembles par ingenierie 
metabolique avec des sequences d'interSt en vue de leur expression optimale. 
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La pr6sente invention donne la liste de genes codant ou susceptibles de coder 
pour des prolines regulant la transcription des genes du cyanophage S-2L. Modifier la 
structure ou l'integrite de ces g6nes pourra permettre de modifier l'expression des genes 
cibles controles par des promoteurs cibles de ces r6gulateurs. Les indications donnees 
5 permettent de plus a l'homme du metier de choisir le ou les regulateurs pertinents pour 
Fapplication recherchee ainsi que leur cible, ce qui pennet Toptimisation de 
l'expression de genes d'interSt. L'utilisation des outils prec^demment decrits tels les 
puces a ADN, permet aussi de reperer Tensemble des gbnes dont la regulation est 
modifiee par cette inactivation. II est ainsi possible de selectionner un ensemble de 
10 sequence de contrdle repondant, a des nuances prds, k un meme type de regulation. Ces 
sequences peuvent etre alors utilisees pour controler Texpression de genes d'interdt 
Selon un autre aspect, 1' invention concerne les polypeptides comprenant : 

a) un polypeptide code par une sequence nucleotidique selon Finvention 
telle que definie precedemment, en particulier un polypeptide code par une ORF ; 
15 b) un polypeptide presentant au moins 80 % de preference 85 %, 90 %, 95 

% et 98 % d'identite avec un polypeptide de a) ; 

c) un fragment biologiquement actif d'au moins 5, 7, 10 acides amines 
d'un polypeptide selon a) ou b) ; 

d) un polypeptide modifie d'un polypeptide selon Tinvention, ou tel que 
20 defini en a), b), ou c). 

L'invention concerne de preference : 

a) les polypeptides du cyanophage S-2L de sequences SEQ ID N°2 a SEQ ID 
N°527, codes respectivement par les ORF 2 a 527, 

b) les 54 polypeptides mentionnes sur le tableau 1 (SEQ ID 
25 ^14,18,26,68,86,92,105,109,134,142,143,148,152,169,175,187, 

208,21 1,234,246,250,257,264,286,298,3 16,332,342,347,348, 

351,355,364,365,369,370,392,395,406,418,422,425,429,432,433,454,464, 

466,472,484,489,494,500. 

c) les 14 polypeptides du cyanophage S-2L, indiques sur le tableau 1 comme 
30 presentant une homologie tr&s significative, de sequence SEQ ID N° 

86,92,152,175,234,257,298,316,395,406,425,484. 
L'invention concerne egalement : 



WO 03/093461 



20 



CT7FR03/01328 



d) les polypeptides pnSsentant au moins 80 % de preference 85 %, 90 %, 95 % et 

98 % d'identite avec un polypeptide de a), b) ,c) 

e) les fragments biologiquement actifs des polypeptides de a), b), c), d) 

f) les polypeptides modifies de a),b),c),d),e). 

5 

L'invention concerne bien entendu tout specialement les polypeptides 
impliqu6s dans la biosynthese des bases D et des intermediates metaboliques de 
cette biosynthese, en particulier le peptide de sequence SEQ ID N°175 k activity 
succidinylate synthetase. 

10 Les phages pour lesquels les modifications sont pr6-r£plicatives 3 ce qui est 

vraisemblablement le cas du cyanophages S-2L, poss£dent les sequences codantes de 
prolines necessaires a la biosynthese des bases modifiees, dans le cas present des 
bases D. De plus, dans la mesure oil les bases D font partie du genome du 
cyanophage, les enzymes polymerases notamment ADN polymerases doivent etre 

15 capables d'avoir la base D specifiquement comme substrat au lieu de la base A. 
L'ADN polymerase du cyanophage S-2L est ainsi capable de discriminer le dDTP du 
dATP. De meme, la transcription depend d'une ARN polymerase specifique et/ou 
d'un facteur sigma specifique. L'invention conceme done selon une realisation 
preferee les polypeptides specifiques a activite ADN polymerase, ARN polymerase 

20 et facteurs associes, en particulier les peptides de sequence SEQ ID N° 92 et SEQ ID 
N°234 qui ont des activites specifiques de la transcription d'ADN comprenant des 
bases D . 

Dans la presente description, les termes polypeptides, sequences 
polypeptidiques, peptides et proteines sont interchangeables. 
25 II doit etre compris que 1* invention ne conceme pas les polypeptides sous 

forme naturelle, c'est-&-dire qu'ils ne sont pas pris dans leur environnement naturel 
mais qu'ils ont pu etre isoies ou obtenus par purification & partir de sources 
naturelles, ou bien obtenus par recombinaison genetique, ou par synthase chimique, 
et qu'ils peuvent alors comporter des acides amines non naturels comme cela sera 
30 decrit plus loin. 

Par polypeptide presentant un certain pourcentage d'identite avec un autre, que 
Ton designera egalement par polypeptide homologue, on entend designer les 
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polypeptides presentant par rapport aux polypeptides naturels, certaines 
modifications, en particulier une deletion, addition ou substitution d'au moins un 
acide amin6, une troncation, un allongement, une solution chimerique et/ou une 
mutation, ou les polypeptides presentant des modifications post-traductionnelles. 
5 Parmi les polypeptides homologues, on pr6f£re ceux dont la sequence d'acides 
amines pr<§sentent au moins 80 %, de preference 85 %, 90 %, 95 % et 98 % 
d'homologie avec les sequences d'acides amines des polypeptides selon rinvention. 
Dans le cas d'une substitution, un ou plusieurs acide(s) amine(s) cons£cutif(s) ou non 
cons6cutif(s) sont remplac£s par des acides amines « Equivalents ». L' expression 

10 « acides amines equivalents » vise ici a designer tout acide amine susceptible d'etre 
substitue a Tun des acides amines de la structure de base sans cependant modifier 
essentiellement les activity biologiques des peptides correspondant et telles qu'elles 
seront d6finies par la suite. 

Ces acides aminos equivalents peuvent etre determines soit en s'appuyant sur 

15 leur homologie de structure avec les acides amines auxquels ils se substituent, soit 
sur des resultats d'essais comparatifs d'activit£ biologique entre les differents 
polypeptides susceptibles d'etre effectues. 

A titre d'exemple, on mentionne les possibility de substitution susceptibles 
d'etre effectuees sans qu'il resulte en une modification approfondie de Factivite 

20 biologique du polypeptide modifie correspondant. On peut remplacer ainsi la leucine 
par la valine ou l'isoleucine, Tacide aspartique par l'acide glutamine, la glutamine 
par l'asparagine, l'arginine par la lysine, etc... les substitutions inverses etant 
naturellement envisageables dans les memes conditions. 

Les polypeptides homologues correspondent egalement aux polypeptides codes 

25 par les sequences nucteotidiques homologues ou identiques, telles que definies 
pr£cedemment et comprennent ainsi dans la pr£sente definition des polypeptides 
mut£s ou correspondant k des variations inter ou intra especes, pouvant exister chez 
le cyanophage S-2L, et qui correspondent notamment k des troncatures, substitutions, 
deletions et/ou additions, d'au moins un r6sidu d'acides amines. 

30 II est entendu que Ton calcule le pourcentage d'identit£ entre deux 

polypeptides de la meme fa9on qu'entre deux sequences d'acides nucl6iques. Ainsi, 
le pourcentage d' identity entre deux polypeptides est calcuie apr&s alignement 
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optimal de ces deux sequences, sur une fenStre d'homologie maximale. Pour d&finir 
ladite fendtre d'homologie maximale, on peut utiliser les memes algorithmes que 
pour les sequences d'acide nucl&que. 

Par fragment biologiquement actif d'un polypeptide selon Pinvention, on 
5 entend designer en particulier un fragment de polypeptide comportant au minimum 5 
acides amines, de preference au moins 7, 10, 15, 25, 50, 75, 100,150, 200, 250, 300 
acides amines, prSsentant au moins me des caract6ristiques biologiques des 
polypeptides selon rinvention, notamment en ce qu'il est capable d'exercer de 
mani&re gen£rale une activity mSme partielle, telle que par exemple : 
10 - une activity enzymatique (m^tabolique) ou une activity pouvant etre 

impliquee dans la biosynthese ou la biod6gradation de composes 
organiques ou inorganiques ; 

- une activite structurelle (enveloppe cellulaire. . .) ; 

- une activite dans le processus de replication, amplification, preparation, 
15 transcription, traduction ou maturation, notamment de PADN, de TARN 

ou des prolines 

- et tout particuli£rement une activity impliquee dans la biosynthese de 
bases D. 

Les fragments de polypeptides peuvent correspondre k des fragments isoles ou 
20 purifies naturellement presents dans les souches du cyanophage S-2L, ou a des 
fragments qui peuvent gtre obtenus par clivage dudit polypeptide par une enzyme 
prot6olitique telle que la trypsine ou la chymotrypsine ou la collagenase, par un 
reactif chimique (bromure de cyanog£ne, CNBr) ou en pla?ant ledit polypeptide dans 
un environnement tres acide (par exemple a pH = 2,5). Des fragments 
25 polypeptidiques peuvent £galement etre pr£par£s par synthese chimique, a partir 
d'hotes transform^ par un vecteur d'expression selon Pinvention qui contiennent un 
acide nucl&que permettant P expression dudit fragment, et place sous le contrdle des 
616ments de regulation et/ou d' expression appropri6s. 

Par « polypeptide modifi6» d'un polypeptide selon Pinvention, on entend 
30 designer un polypeptide obtenu par recombinaison g6n6tique ou par synthase 
chimique comme d&rit plus loin, qui pr£sente au moins une modification par rapport 
k la sequence normale. Ces modifications peuvent Stre notamment port£es sur des 
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acides amines n6cessaires pour la sp6cificite ou Tefficacite de Factivite, ou k 
l'origine de la conformation structural, de la charge, ou de Thydrophobicite du 
polypeptide selon 1' invention. On peut ainsi cr6er des polypeptides d' activity 
equivalente, augment6e ou diminuee, ou de specificite equivalente, plus etroite ou 
5 plus large. Parmi les polypeptides modifies, il faut citer les polypeptides dans 
lesquels jusqu'a cinq acides amines peuvent etre modifies, tronques a Textremite N 
ou C-terminale, ou bien deletes, ou ajoutes. 

Comme cela est indique, les modifications d'un polypeptide ont pour objectif 
notamment : 

10 -de permettre sa mise en oeuvre dans des procedes de biosynthdse ou de 

biodegradation de composes organiques ou inorganiques, 

- de permettre sa mise en oeuvre dans des precedes de replication, 
d' amplification, de reparation et regie de transcription, de traduction, ou 
de maturation notamment de FADN, TARN, ou de proteines, 

15 - de permettre sa secretion amelioree, 

- de modifier sa solubility Tefficacite ou la specificity de son activity ou 
encore de faciliter sa purification. 

La synthase chimique presente egalement Favantage de pouvoir utiliser des 
acides amines non naturels ou des liaisons non peptidiques. Ainsi, il peut Stre 
20 interessant d'utiliser des acides amines non naturels, par exemple sous forme D, ou 
des analogues decides amines, notamment des formes souffrees. 

Sous un autre aspect, de maniere pr6fer6e, l'invention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de de 
cyanophage S-2L ou un de ses fragments representatifs implique dans le m6tabolisme 
25 des nucleotides, des purines, des pyrimidines ou nucleosides. 

Sous un autre aspect, de manure pr6feree, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de de 
cyanophage S-2L ou un de ses fragments representatifs impliqu6 dans le processus de 
replication, et en ce qu'il est choisi parmi les polypeptides de sequence SEQ ID 
30 N°14,18,142,355,429,454 et un de leurs fragments. 

L'invention concerne de maniere tres avantageuse des polypeptides de 
cyanophage S2L d'au moins 7 acides amines et ayant une activite adenylosuccinate 
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synthetase. De manidre pref6r6e, de tels fragments comprennent le motif GSTGKG. 
En plus des resultats biologiques (metabolisme specifique du cyanophage S2L 
capable de synth&iser et de polymeriser de l'ADN incorporant des bases D), les 
inventeurs ont en effet identifie, des sites consensus en particulier les zones site de 
5 liaison de phosphate et d'IMP, On retrouve en particulier le fragment QYGSTGKG, 
proche de la signature Prosite QWGDEGKG attribute a l'adenylosuccinate 
synth6tase, ou le fragment GSTGKG proche du fragment GDEGKG commun a 
Escherichia coli s Methanobacterium thermaoautotrophicum, Pyrococcus horikosshi 
OT3. Les inventeurs ont identifie des homologies significatives pour les activit&s 

10 adenylosuccinate synthetase, helicase, facteur sigma, ces trois activity etant a priori 
directement liees etroitement avec le metabolisme specifique des bases D. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de de 
cyanophage S-2L ou un de ses fragments implique dans le processus de transcription, 

15 et en ce qu'il est choisi parmi les polypeptides de sequece SEQ ID N°92,143,187 et 
un de leurs fragments representatifs. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide 
d'enveloppe de cyanophage S-2L ou un de ses fragments, et en ce qu'il est choisi 

20 parmi les polypeptides correspondant aux ORF169,316,351,392,395,406,422,425 et 
un de leurs fragments representatifs. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caract6rise en ce qu'il s'agit d'un polypeptide de de 
cyanophage S-2L ou un de ses fragments representatifs implique dans le 

25 detournement de la machinerie cellulaire ou dans le metabolisme intermediate. 

Sous un autre aspect, de maniere pr£fer6e, l'invention a pour objet un 
polypeptide selon l'invention, caracteris6 en ce qu'il s'agit d'un polypeptide de de 
cyanophage S-2L ou un de ses fragments representatifs implique dans le processus de 
virulence, notamment le polypeptide de sequence SEQ ID N°247 et un de ses 

3 0 fragments representatifs. 

Sous un autre aspect, de maniere preferee, l'invention a pour objet un 
polypeptide selon l'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
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cyanophage S-2L ou un de ses fragments implique dans les fonctions relatives aux 
transposons, notamment le polypeptide de sequence SEQ ID N°208 et un de ses 
fragments repr6sentatifs. 

5 II faut noter toutefois qu'un organisme vivant est un tout et doit etre pris 

comme tel. Ainsi, afin de pouvoir se developper et d'exhiber ses proprietes, tout 
organisme a besoin d' interactions entre les diff&rentes voies metaboliques. Ainsi, la 
classification 6nonc6e ci-dessus ne doit pas Stre consider comme limitative, un 
g£ne pouvant Stre implique dans plusieurs voies metaboliques distinctes. 

10 La pr^sente invention a egalement pour objet les sequences nucieotidiques 

et/ou de polypeptides selon Finvention, caracterisees en ce que lesdites sequences 
sont enregistrees sur un support d'enregistrement dont la forme et la nature facilitent 
la lecture, Fanalyse et/ou F exploitation de ladite ou desdites s<§quence(s). Ces 
supports peuvent egalement contenir d'autres informations extraites de la prdsente 

15 invention, notamment les analogies avec des sequences dej& connues, comme 
mentionn6 dans le Tableau 1 et/ou des informations concernant les sequences 
nucieotidiques et/ou de polypeptides d'autres microorganismes afin de faciliter 
Fanalyse comparative et 1 5 exploitation des rSsultats obtenus. 

Parmi cesdits supports d'enregistrement, on pref&re en particulier les supports 

20 lisibles par un ordinateur, tels les supports magnetiques, .optiques, electriques ou 
hybrides, en particulier les disquettes informatiques, les CD-ROM, les serveurs 
informatiques. De tels supports d'enregistrement sont egalement objet de Finvention. 

Les supports d'enregistrement selon Finvention, avec les informations 
apportees, sont tres utiles pour le choix d'amorces ou de sondes nucieotidiques pour 

25 la determination de g£nes dans le cyanophage S-2L ou souches proches de cet 
organisme. De meme, Futilisation de ces supports pour F etude du polymorphisme 
g6n6tique de souche proche de du cyanophage S-2L, en particulier par la 
determination des regions de colin£arite, est tr&s utile dans la mesure oil ces supports 
fournissent non seulement la sequence nucieotidique du genome du cyanophage S- 

30 2L, mais Egalement Forganisation g&iomique dans ladite sequence. Ainsi, les 
utilisations de supports d'enregistrement selon Finvention sont egalement des objets 
de Finvention. 
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Un procede d' etude du polymorphisme g6netique entre les souches proches du 
cyanophage S-2L, par determination des regions de colinearite, peut comprendre les 
etapes de 

- fragmentation de l'ADN chromosomal de ladite autre souche (sonication, 
5 digestion), 

- sequence des fragments d'ADN, 

- analyse d'homologie avec le genome du cyanophage S-2L (SEQ ID N° 1). 
Ce procede qui comprend une etape d* analyse d'homologie avec le genome du 

cyanophage S-2L, en particulier gr&ce a l'aide d'un support d'enregistrement, est 
1 0 egalement l'objet de l'invention. 

L' analyse d'homologie entre differentes sequences s'effectue en effet 
avantageusement a l'aide de logiciels de comparaisons de sequences, tels le logiciel 
Blast, ou les logiciels de la trousse GCG, decrits precedemment. 

L'invention vise egalement une sequence nucleotidique telle que decrite 
15 precedemment, immobUis6e sur un support, de maniere covalente ou non-covalente, 
notamment im filtre a haute densite ou une puce a ADN. 

L'invention vise Egalement une sequence nucleotidique telle que decrite 
precedemment pour la detection et/ou 1' amplification de sequences nucieiques. 

Selon une realisation un tel procede de detection et d' amplification comprend 
20 par exemple les etapes suivantes : 

a) eventuellement, isolement de l'ADN a partir de l'echantillon biologique 
k analyser, ou obtention d'un ADNc a partir de 1'ARN de l'echantillon 
biologique ; 

b) amplification specifique de l'ADN du cyanoptiages S-2L a l'aide d'au 
2 5 moins une amorce selon l'invention ; 

c) mise en evidence des produits d'amplification. 

Ce proc6de est base sur 1' amplification specifique de l'ADN, en particulier par 
une reaction d' amplification en chaine. 

On prefere egalement un procede comprenant les etapes suivantes : 
30 a) mise en contact d'une sonde nucleotidique selon l'invention avec un 

echantillon biologique, l'acide nucieique contenu dans l'echantillon 
biologique ayant, le cas ech6ant, prealablement 6te rendu accessible k 
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Fhybridation, dans des conditions permettant Fhybridation de la sonde 
a Facide nucleique du cyanophage S-2L ; 
b) mise en evidence de Fhybride eventuellement forme entre la sonde 
nucleotidique et F ADN de l'echantillon biologique. 
5 Un tel precede ne doit pas etre limits a la detection de la presence de FADN 

contenu dans l'echantillon biologique atteste, il peut etre egalement mis en oeuvre 
pour detecter TARN contenu dans ledit echantillon. Ce precede englobe en 
particulier les Southern et Northern blot. 

Ainsi, la pr6sente invention englobe egalement un kit ou n6cessaire pour la 
10 detection et/ou 1' identification de cyanophage S-2L, caracteris^ en ce qu'il comprend 
les elements suivants : 

a) une sonde nucleotidique selon T invention ; 

b) eventuellement, les reactifs necessaires a la mise en oeuvre d'une 
reaction d'hybridation ; 

15 c) eventuellement, au moins une amorce selon Finvention ainsi que les 

reactifs necessaires a une reaction d' amplification de FADN. 
De m£me, la presente invention englobe egalement les kits ou necessaires pom- 
la detection et/ou 1' identification de cyanophage S-2L, comprenant les elements 
suivants : 

20 a) une sonde nucleotidique, dite sonde de capture, selon T invention; 

b) une sonde oligonucieotidique, dite sonde de revelation, selon 
Finvention ; 

c) eventuellement, au moins une amorce selon Finvention ainsi que les 
reactifs necessaires a une reaction d' amplification de FADN. 

25 L'invention vise egalement les vecteurs de clonage et/ou d' expression, qui 

contiennent une sequence nucleotidique selon Finvention. On prefSre en particulier 
les sequences nucieotidiques codant pour des polypeptides impliques dans le 
metabolisme nucleotides, des purines, des pyrimidines ou nucleosides. 

Les vecteurs selon Finvention comportent de preference des elements qui 
30 permettent F expression et/ou la secretion des sequences nucieotidiques dans une 
cellule h6te determinee. 

Le vecteur doit alors comporter un promoteur, des signaux d 5 initiation et de 
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terminaison de la traduction, ainsi que des regions appropriees de regulation de la 
transcription. II doit pouvoir Stre maintenu de fa9on stable dans la cellule hdte et peut 
eventuellement poss6der des signaux particuliers qui sp6cifient la secretion de la 
proline traduite. Ces diffcrents elements sont choisis et optimises par I'homme du 
5 metier en fonction de Fhdte cellulaire utilise. A cet effet, les sequences 
nucieotidiques selon Pinvention peuvent etre inserees dans des vecteurs a replication 
autonome au sein de Phdte choisi, ou etre des vecteurs integratifs de Phote choisi. 

De tels vecteurs sont prepares par des methodes couramment utilis^es par 
Phomme du metier, et les clones resultant peuvent dtre introduits dans un h6te 
10 approprie par des methodes standard, telle que la lipofection, Peiectroporation, le 
choc thermique, ou des methodes chimiques. 

Les vecteurs selon Pinvention sont par exemple des vecteurs d'origine 
plasmidique ou virale. lis sont utiles pour transformer des cellules h6tes afin de 
doner ou d'exprimer les sequences nucieotidiques selon Pinvention. On peut utiliser 
15 comme vecteur directement le cyanophage S-2L lui-meme. 

L'invention comprend egalement les cellules hdtes transformees par un vecteur 
selon Pinvention. 

L'h6te cellulaire peut etre choisi parmi des systemes procaryotes ou 
eucaryotes, par exemple les cellules bacteriennes mais egalement les cellules de 

20 levure ou les cellules animates, en particulier les cellules de mammiferes. On peut 
egalement utiliser des cellules d'insectes ou des cellules de plantes. Les cellules hotes 
preferees selon Pinvention sont en particulier les cellules procaryotes. Les cellules 
transformees selon Pinvention sont utilisables dans des precedes de preparation de 
polypeptides recombinants selon Pinvention. 

25 Les precedes de preparation d'un polypeptide d'interet selon Pinvention sous 

forme recombinante, hors de Penvironnement naturel, caracterises en ce qu'ils 
mettent en oeuvre un vecteur et/ou une cellule transformee par un vecteur selon 
Pinvention sont eux-memes compris dans la presente invention. L'utilisation du 
cyanophage S-2L poxir la production de tels peptides fait done egalement partie de 

30 Pinvention. 

De preference, on cultive une cellule transformee par un vecteur selon 
Pinvention dans des conditions qui permettent Pexpression dudit polypeptide 
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d'interet et on recupere ledit peptide recombinant. Les cellules hotes selon 
l'invention peuvent egalement Stre utilises pour la preparation de compositions 
alimentaires, qui sont elles-memes objet de la presente invention. 

Un tel proc6d6 d'obtention de prolines d'interet du cyanophage S-2L, 
5 comprend selon une realisation Pinsertion de g&nes d'interet du genome du phage S- 
2L, typiquement par ligation, dans des vecteurs de clonage et d' expression, dans des 
conditions permettant leur expression par la prise en charge par la machinerie de 
replication d ! un organisme h6te comme E. coli, et Fextraction des proteines 
produites. 

10 Les messages h&reditaires du phage recopies sous forme d'ADN canonique sont 

aptes a s'exprimer comme des gfenes de cyanobacteries. Les ARN messagers emis 
apres r6ecriture de l'ADN de S-2L chez E. coli sont traduits en des proteines 
identiques a celles produites au cours de l'infection de Synechococcus par S-2L. 

Selon une realisation preferee les polypeptides d'interSt sont des proteines 

15 impliquees dans le m&abolisme de bases D, notamment la succinyladenylate 
synthetase . 

En effet, il a 6t6 precise plus haut qu'une base D est vraisemblablement 
fonnee par modification pre-replicative et que des genes cellulaires ont 6te recrutes k 
cette fin, deux voies de biosynth&se se pr6sentant pour former Ie dDTP a partir d ! un 

2 0 desoxynucleotide canonique, soit dAMP soit dGMP. 

Suivant la premiere voie (figure 2a), le monomere active dATP est d'emblee 
hydrolyse en dAMP par une enzyme du type de celle codee par dut chez E, coli (9) 
ou du produit du g&ne mutT (9), ce qui a pour double effet de barrer l'acces de dATP 
a la synthese de l'ADN et de fournir le precurseur de DMP. La biosynthese de celui- 

25 ci s'effectue suivant les deux reactions successives convertissant IMP en GMP dans 
le m&abolisme cellulaire (9) ; le nucleotide est finalement active en dDTP en deux 
etapes de phosphorylation. 

Suivant la deuxteme voie (figure 2b), dDMP est obtenu en appliquant k dGMP 
les deux reactions convertissant dans les cellules IMP en AMP (9). Si elle prend 

30 aussi comme precurseur le dATP, cette deuxidme voie est plus longue car dGMP doit 
prealablement etre synthetise vie dIMP. Tout au long de cette deuxi^me voie, trois 
dNTP specifiques et mutagfenes sont formes (dIMP, dXMP et dSMP), contre im seul 
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(diGMP) dans la premiere (figure 2a). 

Comme cela sera decrit plus loin les inventeurs ont reussi k identifier un ORF 
codant pour une enzyme de la seconde voie, la succinyladenylate synthetase. 

Selon une autre realisation pr6f6r6e, les polypeptides d'interet sont des 
5 polymerases de cyanophages S-2L, capables de polym6riser des bases D, ce qui 
permet la propagation des acides nucleiques incorporant des bases D in vitro et in 
vivo. 

Les inventeurs obtiennent en particulier des ADN polymerases sp£cialistes des 
duplex de haute stability et inaptes k repliquer dA pris comme constituant de la 
10 matrice ou comme monomdre triphosphate. Ces ADN polymerases seront 
typiquement obtenues par un precede comprenant tine etape d' expression, hors de 
Fenvironnement naturel, du gene de ladite ADN polymerase dans des bacteries 
recombinantes. 

Selon une realisation preferee les polypeptides d'interet sont des polypeptides 

15 capables de modifier la transcription de l'ADN de cellules h6tes du cyanophage S-2L 
En effet la transcription du genome de S-2L d f une ARN polymerase sur 
mesure, meme si celle-ci n'est pas codee dans le phage. On sait que des enzymes de 
T4 alterent TARN polymerase & % E. coll Les promoteurs presents dans le genome de 
S-2L devient du consensus connu de l'homme du metier (TATA box en particulier). 

20 II est vraisemblable que des facteurs d ! amor9age de la transcription (sigma ou autre) 
soient codes ou modifies par le phage, voire a ce qu ! ils soient embarques dans la 
capside pour permettre le declenchement du programme viral. Quoi qu f il en soit, le 
sequen9age effectue par les inventeurs permet d' identifier sans effort excessif 
certains g£nes de S-2L responsables du contrdle de la transcription par alteration 

2 5 chimique de TADN. 

Ainsi qu'il a ete dit, Thote cellulaire peut 6tre choisi parmi des systemes 
procaryotes ou eucaryotes. En particulier, il est possible d'identifier des sequences 
nucieotidiques selon Tinvention, facilitant la secretion dans un tel systeme 
procaryote ou eucaryote. Un vecteur selon V invention portant une telle sequence peut 

30 done Stre avantageusement utilise pour la production de proteines recombinantes, 
destinees a Stre s6cretees. En effet, la purification de ces proteines recombinantes 
d'interSt sera facilite par le fait qu'elles sont pr6sentes dans le sumageant de la 
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culture cellulaire plutot qu'& l'interieur des cellules hotes. 

On peut egalement preparer les polypeptides selon Finvention par synthese 
chimique. Un tel proc6d6 de preparation est egalement un objet de Pinvention. 
L'homme du metier connait les precedes de synthase chimique, par exemple les 
5 techniques mettant en ceuvre des phases solides (voir notamment Steward et al., 
1984, Solid phase peptides synthesis, Pierce Chem. Company, Rockford, 111, 2£me 
6d., (1984)) ou des techniques utilisant des phases solides partielles, par condensation 
de fragments ou par une synthase en solution classique. Les polypeptides obtenus par 
synthase chimique et pouvant comporter des acides amines non naturels 

1 0 correspondant sont Egalement compris dans l'invention. 

L'invention comprend egalement les polypeptides hybrides qui comprennent 
au moins la sequence d'un polypeptide selon Pinvention, et la sequence d'un 
polypeptide susceptible d'induire une reponse immunitaire chez Phomme ou 
r animal. L'invention comprend egalement les sequences nucieotidiques qui codent 

15 pour de tels polypeptides hybrides, ou les vecteurs qui contiennent ces sequences 
nucieotidiques. Ce couplage entre un polypeptide selon V invention et un polypeptide 
immunogene d'int6r@t, peut etre effectue par voie chimique, ou par voie biologique. 
Ainsi, selon l'invention, il est possible d'introduire un ou plusieurs element(s) de 
liaison, notamment des acides amines pour faciliter les reactions de couplage entre le 

20 polypeptide selon Pinvention, et le polypeptide immunostimulateur, le couplage 
covalent de Pantig&ne immunostimulateur pouvant etre realise a I'extremite N ou C- 
terminale du polypeptide selon Pinvention. Les reactifs bifonctionnels permettant ce 
couplage sont determines en fonction de Pextremite choisie pour realiser ce 
couplage, et les techniques de couplage sont bien connues de Phomme du metier. 

25 Les conjugu6s issus d'un couplage de peptides peuvent etre egalement prepares 

par recombinaison genetique. Le peptide hybride (conjugu6) peut en effet etre produit 
par des techniques d'ADN recombinant, par insertion ou addition a la sequence 
d'ADN codant pour le polypeptide selon T invention, d'une sequence codant pour le 
ou les peptide(s) antigdne(s), immunogdne(s) ou hapt£ne(s). Ces techniques de 

30 preparation de peptides hybrides par recombinaison genetique sont bien connues de 
Thomme du metier (voir par exemple Makrides, 1996, Microbiological Reviews 
60,512-538). 
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De preference, ledit polypeptide immunitaire est choisi dans le groupe des 
peptides contenant les anatoxines, notamment le toxoide dipht6rique ou le toxoJde 
tetanique, les proteines d6rivees du Streptocoque (comme la proteine de liaison a la 
s&albumine humaine), les prolines membranaires OMPA et les complexes de 
5 prolines de membranes externes, les vesicules de membranes extemes ou les 
proteines de chocs thermiques. 

Les sequences nucleotidiques et vecteurs, codant pour un polypeptide hybride 
selon 1'invention sont egalement objet de Finvention. 

Les polypeptides hybrides selon Pinvention sont tres utiles pour obtenir des 
10 anticorps monoclonaux ou polyclonaux, capables de reconnaitre spScifiquement les 
polypeptides selon Finvention. En effet, un polypeptide hybride selon Finvention 
permet la potentiation de la reponse immunitaire, contre le polypeptide selon 
Finvention couple a la molecule immunogene. De tels anticorps monoclonaux ou 
polyclonaux, leurs fragments, ou les anticorps chimeriques, reconnaissant les 
15 polypeptides selon Finvention, sont egalement objets de Finvention. 

Les anticorps monoclonaux specifiques peuvent 6tre obtenus selon la methode 
classique de culture d'hybridome decrite par Kohler et Milstein (1975, Nature 256, 
495). 

Les anticorps selon Finvention sont par exemple des anticorps chimeriques, des 
20 anticorps humanisms, des fragments Fab, ou F(ab') 2 . II peut egalement se presenter 
sous forme d'immunoconjugu6 ou d'anticorps marque afin d'obtenir un signal 
d6tectable et/ou quantifiable. 

Les anticorps selon la pr^sente invention sont notamment utilisables afin de 
detecter une expression d'un gene de cyanophage S-2L. En effet, la presence du 
25 produit d' expression d'un gSne reconnu par un anticorps specifique dudit produit 
expression peut dtre d6tect6e par la presence d'un complexe antigdne-anticorps form6 
apres la mise en contact d'une bacterie recombinante exprimant un gene d'interet 
donn6 du cyanophage S-2L avec un anticorps selon Finvention. La souche 
bact&ienne utilis^e peut avoir 6t6 « pr6par6e », c'est-a-dire centrifug6e, lys6e, placde 
30 dans un r6actif approprte pour la constitution du milieu propice k la reaction 
immunologique. En particulier, on pr6f&re un precede de detection de Fexpression 
d'un g&ne, correspondant & un Western blot, pouvant gtre effectu6 aprfes une 
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eiectrophor&se sur gel de polyacrylamide d'un lysat de la souche bacterienne, en 
presence ou en 1'absence de conditions reductrices (SDS-PAGE). Apr£s migration et 
separation des prolines sur le gel de polyacrylamide, on transfere lesdites prolines 
sur une membrane appropriee (par exemple en nylon) et on detecte la presence de la 
5 proteine ou du polypeptide d'interSt, par mise en contact de ladite membrane avec un 
anticorps selon Tinvention. 

Les polypeptides et les anticorps selon Tinvention peuvent avantageusement 
6tre immobilises sur un support, notamment une puce k proteines. Une telle puce k 
prolines est un objet de l'invention, et peut egalement contenir au moins un 

10 polypeptide d'un microorganisme autre que le cyanophage S-2L ou un anticorps 
dirige contre un compose d'un microorganisme autre que cyanophage S-2L. 

Les puces k proteines ou filtres a haute densite contenant des proteines selon 
l'invention peuvent Stre construits de la meme maniere que les puces a ADN selon 
Tinvention. En pratique, on peut effectuer la synthese des polypeptides fixes 

15 directement sur la puce a proteines, ou effectuer une synthese ex situ suivie d'une 
etape de fixation du polypeptide synthetise sur ladite puce. Cette derni&re methode 
est preferable, lorsque Ton desire fixer des proteines de taille importante sur le 
support, qui sont avantageusement preparees par genie g&ietique. Toutefois, si Ton 
ne desire fixer que des peptides sur le support de ladite puce, il peut etre plus 

20 interessant de proceder k la synthase desdits peptides directement in situ. 

De preference, on fixe un anticorps selon l'invention sur le support de la puce a 
proteines, et on detecte la presence de l'antigdne correspondant, specifique de 
Cyanophage S-2L ou d'un microorganisme associe. 

Une puce k proteines ci-dessus d£crite peut etre utilisee pour la detection de 

25 produits de genes, pour etablir un profil d' expression desdits g£nes, en complement 
d'une puce a ADN selon l'invention. 

Les puces a proteines selon l'invention sont egalement extrgmement utiles pour 
les experiences de proteomique, qui etudie les interactions entre les differentes 
proteines d'un microorganisme donne. De fa9on simplifiee, on fixe des peptides 

3 0 representatifs des differentes proteines d'un organisme stir un support. Puis, on met 
ledit support en contact avec des proteines marquees, et aprds une etape optionnelle 
de linage, on detecte des interactions entre lesdites proteines marquees et les 
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peptides fix6s sur la puce a prolines. 

Ainsi, les puces a prolines comprenant une sequence polypeptidique selon 
rinvention ou un anticorps selon T invention sont objet de 1' invention, ainsi que les 
kits ou n6cessaires les contenant. 
5 De pr&f&rence, les amorces et/ou sondes et/ou polypeptides et/ou anticoips 

selon la pr&ente invention utilises dans les proc£d6s selon la pr^sente invention sont 
choisis parmi les amorces et/ou sondes et/ou polypeptides et/ou anticorps specifiques 
du Cyanophage S-2L 

La pr6sente invention a Sgalement pour objet les souches de Cyanophage S-2L 
10 et/ou de microorganismes associ^s contenant une ou plusieurs mutation(s) dans une 
sequence nuclSotidique selon rinvention, en particulier une sequence ORF, ou leurs 
elements regulateurs (en particulier promoteurs). 

On prcSfere, selon la presente invention, les souches de Cyanophage S-2L 
presentant une ou plusieurs mutation(s) dans les sequences nucleotidiques codant 
15 pour des polypeptides impliques dans le metabolisme des bases D, la replication et la 
transcription. 

Lesdites mutations peuvent mener a une inactivation du gene, ou en particulier 
lorsqu'elles sont situees dans les Elements regulateurs dudit g6ne, k une 
surexpression de celui-ci. 

20 Ainsi, on recherche en particulier des souches de Cyanophage S-2L sur- 

exprimant un polypeptide selon rinvention, impliquees dans les fonctions relatives a 
la synthese de bases D ou de polynucleotides incorporant au moins une base D. 

I/art ant^rieur fait 6tat de la connaissance du metabolisme specifique du de 
cyanophage S-2L, conduisant k la synthese de bases D au lieu de bases A. Toutefois, 

25 jusqu'a present, sans connaitre la sequence exacte du cyanophage S-2L, Fhomme du 
metier n'avait pas k sa disposition les sequences ORP codantes et done ne pouvait 
effectivement notamment doner une sequence ORF donn6e, tester T activity 
biologique correspondante et exprimer des polypeptides d'int6ret. Ce type de proc6d6 
est d6sormais possible gr&ce au s^que^age du genome du cyanophage S-2L effectu6 

3 0 par les inventeurs. 

Meme sans connaitre exactement k ce stade avec certitude la voie de synthase 
des bases D, les inventeurs ont r&issi k identifier des sequences codantes impliquees 
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dans cette voie metabolique. En testant successivement, mais sans effort excessif 
pour l'homme du metier, la fonction biologique des ORF susceptibles d'intervenir 
dans cette voie metabolique k partir des r6sultats obtenus (plus spetialement les ORF 
du groupe des polypeptides intervenant dans le metabolisme nucleotides, des purines, 
5 des pyrimidines ou nucleosides), les inventeurs peuvent done rep6rer celles qui 
codent pour les proteines determinant cette voie. 

L'invention concerne egalement selon un autre aspect l'utilisation des 
sequences polypeptidiques telles que decrites precedemment pour la production de 
bases D et ou de sequences polynucieotidiques comprenant des bases D. Ces 

10 sequences polynucieotidiques seront notamment des sequences ADN, ou ARN, en 
particulier des ARNm. 

L'invention concerne selon un autre aspect un procede d'obtention de bases D 
et/ou de polynucleotides d'interSt comprenant au moins une base D, ledit procede 
comportantla culture d'un microorganisme contenant au moins une sequence 

15 nucieotidique de cyanophage S-2L codante pour au moins un polypeptide implique 
dans la synthase de bases D, dans des conditions appropriees pour le developpement 
du vecteur et la synthase de bases D. Tpiquement le microorganisme cultive . 
comprend un vecteur tel que decrit precedemment contenant la ou lesdites sequences 
nucieotidiques de cyanophage S-2L codantes. 

2 0 Selon une realisation un tel procede comprend : 

- l'addition a un milieu comprenant les substrats necessaires a Pobtention 
de bases D, d'un extrait ou melange d'extraits de bacteries recombinantes 
exprimant au moins un gene de cyanophage S-2L implique dans la 
synthese de bases D 

25 - le cas echeant 1' extraction de bases D et/ou dedits polynucleotides 

d'interet 

Selon une realisation un tel procede comprend : 

- la preparation d'au moins une sequence ADN codante pour un 
polypeptide capable de provoquer chez un microorganisme hote la 

3 0 synthase d'au moins une base D 

- le clonage de ladite sequence codante dans un vecteur capable d'etre 
tranf6re dans et de se r6pliquer dans ledit microorganisme h6te, ce 
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vecteur comprenant les elements necessaires k ^expression de ladite 
sequence codante 

- le ixansfert du vecteur comprenant ladite sequence codante dans un 
microorganisme capable de produire les enzymes de la synthese de bases 

5 D dirigde par ladite sequence codante 

- la culture du microorganisme dans des conditions approprtees pour le 
developpement du vecteur et la synthese des bases D 

- le cas 6cheant Fextraction de bases D et/ou dedits polynucleotides 
d'interSt 

10 Comme sela sera d£crit plus loin, les inventeurs ont reussi a doner de l'ADN 

contenant des bases D, en utilisant des enzymes de restriction dont les sites de 
restriction ne possedent pas de base A, notamment Smal (site CCCGGG), SacII (site 
CCGCGG), Mspl (site CCGG), BspRI (site GGCC). Les inventeurs ont montre que 
des enzymes de restriction comprenant au moins une base A n'hydrolysent pas 

15 l'ADN de S-2L : BamHl (GCATCC), EcoRI (GAATTC), HindHI (AAGCTT), 
Sau3AI (GATC). Pour cela les inventeurs sont all6s k l'encontre d'un pr^juge 
technique, k savoir que le clonage d'un ADN comprenant des bases D pourrait 
conduire a des ambiguites de copie lors du clonage. En effet, comme indique sur la 
figure 4, le clonage de « D DNA» chez E.Coli, est susceptible de conduire a des 

20 sequences differentes de celles issues du clonage de « A DNA ». 

L'invention conceme selon un autre aspect un procede d'obtention de bases D 
et/ou de polynucleotides d 5 int6r§t comprenant au moins une base D ledit procede 
comportant : 

- T addition, a un milieu comprenant les substrats necessaires a Tobtention 
25 de bases D, du produit d' expression d'au moins un gene de cyanophage S- 

2L impliquS dans la synthese de bases D, de maniere a produire des bases 
D et/ou des polynucleotides d'interSt comprenant au moins une base D 

- le cas 6ch6ant P extraction des bases D et/ou dedits polynucleotides 
d'intfrfit 

30 Dans les proc£d6s mentionn6s ci-dessus, par synthase de bases D et/ou de 

polynucleotides comprenant au moins une base D, on entend que les conditions de la 
synthase sont telles que Ton obtienne uniquement ou essentiellement des bases D, ou 
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uniquement ou essentiellement des polynucleotides comprenant au moins une base 
D, ou a la fois des bases D et des polynucleotides comprenant au moins une base D 
dans des quantites souhaitees. Les quantities produites de bases D et de 
polynucleotides comprenant au moins une base D dependront notamment du contr61e 
5 de Pexpression de prolines impliquees dans la synthases des bases D et dans 
Incorporation des bases D lors de P elongation des chafries polynucleotidiques. 

Selon un autre aspect Pinvention conceme un proced6 d'obtention de 
polynucleotides d'int6ret comprenant au moins une base D, ledit proc6de 
comprenant la culture d'un microorganisme contenant au moins une sequence 

10 nucieotidique de cyanophage S-2L codante pour au moins un polypeptide implique 
dans Peiongation desdits polynucleotides avec incorporation de bases D, ADN 
polymerase notamment, dans des conditions appropriees pour le developpement du 
vecteur et T elongation desdits polynucleotides. 

Selon un autre aspect Pinvention conceme Putilisation du cyanophage S-2L 

15 pour la production de reactifs utiles pour des reactions PCR ou PCR Like faisant 
intervenir des bases D. En particulier selon un mode de realisation pr£fer6 ces reactifs 
seront des monomeres dDTP. 

En effet, le monomdre dDTP est un bon substrat des ADN polymerases du 
cyanophage S-2L, et des matrices comportant la base D sont efficacement repliqu6es 

20 (1). La production biotechnologique de dD, dDMP et dDTP s f applique ainsi aux 
techniques de PCR, en augmentant la stabilite thermique des duplex, ou en masquant 
et en demasquant de nombreux sites de restriction (10). On entend que cette 
production n'est pas une production dans Penvironnement naturel, la production 
dans Penvironnement naturel signifiant une production par le cyanophage S-2L lui- 

25 meme. 

L'invention conceme egalement un procede de production de polynucleotides 
d'interet comprenant au moins une base D, ledit procede comportant une etape 
d'amplification, en presence de polymerase de cyanophage D et d'amorces 
appropriees, de polynucleotides comprenant au moins une base D. 
30 Gr&ce k ce procede, selon une technique de type PCR ou PCR like, k partir 

d'un polynucleotide d'interet comprenant au moins une base D de sequence connue, 
on obtient un grand nombre d'exemplaires de ce nucleotide. 
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Selon une realisation le g£ne implique dans la synthase de polynucleotides 
d'int£r6t comprenant au moins une base D est le g&ne de la succinyladenylate 
synthetase. En effet, la succinyladenylate synthetase (ddba) catalyse la reaction de 
dGMP au dSMP lui-meme transforme en dDMP (figure 2). 
5 Selon une realisation les polynucleotides d'interSt sont des nucleosides 

d'interet therapeutique. 

Selon une realisation, les polynucleotides d'interdt sont produits par 
hemisynthese ou par fermentation. 

L'invention concerne en outre un procede de selection de composes capables 
10 de stimuler ou d'inhiber la synthase de bases D et/ou de polynucleotides d'interet 
incorporant au moins une base D, comprenant P addition au milieu de synthase du 
compose teste et la comparaison de la synthase en presence et en absence dudit 
compose. 

L'invention concerne selon un autre aspect Putilisation des sequences 
15 nucieotidiques de cyanophage S-2L telles que decrites precedemment pour tester leur 
fonction dans le metabolisme des nucleotides, des purines, des pyrimidines ou 
nucleosides, la replication et la transcription. 

Selon un autre aspect Pinvention concerne Putilisation du cyanophage S-2L 
pour la determination de genes permettant de reparer les mesappariements G :T ou 
20 iG :T survenant par desamination. 

En effet, la base D elle-meme est connue comme xm mutag^ne chez E. colt. Ce 
fait pouirait s'expliquer par le fait que la desamination de D a la position 2 mene a 
1'isoguanine (iG), dont il a ete recemment montre que le desoxynucieoside est 
mutagene (M. Bouzon, P. Marliere, resultats non publies). La desamination de D a la 
25 position 6 mene a la guanine. Que cette derniere reaction de desamination survienne 
aprfes incorporation de D dans l'ADN, elle resultera en une mutation au cycle de 
replication suivant. Grace au sequencage realise, Tidentification de genes aptes k 
reparer les mesappariements G:T ou iG:T survenant par desamination est desormais 
possible. 

30 Selon un autre aspect Pinvention concerne Putilisation du cyanophage S-2L 

pour 1' identification de gdnes et la production de proteines capables de r6generer des 
S'-termini. 
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En effet, la replication de l'ADN du cyanophage., dont la stabUite est eievee 
(7,8), pourrait par ailleurs exiger des proteines auxiliaires (helicase, SSB) sur mesure. 
Le genome est constitue d'un duplex linSaire, ce qvii suppose une machinerie de 
regeneration des 5-tennini, comme l'endonuclease utilis6e pour resoudre les 
5 concatemeres chez T7 (4), ou la proline d'adduction en 5 ! chez phi29 (6), dont 
Tactivite pourrait necessiter la presence de D dans leurs substrats. 

Selon un autre aspect Tinvention concerne Putilisation du cyanophage S-2L 
pour Tidentification de genes capables de moduler l'activite des ribosomes 

En effet, le cyanophage S-2L est par ailleurs susceptible de former un 
10 pr6curseur ribonuclotidique portant la base D, pour le reduire ensuite en un 
desoxyribonucleotide correspondant, comme il advient pour les quatre bases de 
TARN (9). Dans ce cas, la transcription et la traduction des g£nes phagiques 
pourraient s'effectuer via l'utilisation de codons, voire de tARNs comme chez T4 et 
T5, comportant cette base. Si une telle option a ete empruntee par le phage, il est 
15 possible que certains de ses g£nes modulent l'activite des ribosomes. 

Selon un autre aspect 1' invention concerne Futilisation du cyanophage S-2L 
pour Tidentification ou la production de composes inhibiteurs de la biosynthese des 
nucleotides puriques. 

En effet les genomes phagiques specifient toute une gamme d'inhibiteurs ayant 
20 pour cible des enzymes cellulaires telles que la thymidylate synthase, la dUTPase, 
etc. (11). Dans le cas de S-2L, les inventeurs peuvent desormais identifier des 
inhibiteurs capables d'affecter la biosynthese des nucleotides puriques. 

L' invention concerne ainsi egalement un procede utilisant de tels inhibiteurs 
pour contrSler le metabolisme ou Texpression genetique de cellules susceptibles 
25 d'etre infectees par un cyanophage S2L, notamment des cyanobacteries. 

Dans la mesure oii le controle du metabolisme des acides nucieiques ou 
nucleosides, en particulier des pyrimidines de 1'ADN, est trds utile en chimiotherapie 
et genotherapie (2), Pinvention concerne aussi un procede utilisant de tels inhibiteurs 
pour controler ce metabolisme. 

30 

D'autres aspects et avantages de l'invention apparaitront k la lecture de la 
description qui suit illustree par les figures dans lesquelles : 
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- la figure 1 repr6sente quelques exemples de bases modifiees 

- les figures 2a et 2b representent deux voies de biosyntheses possibles pour 
la synthese de bases D par le cyanophage S-2L, la voie de la figure 2b 
6tant la plus vraisemblable 

5 - la figure 3 illustre sch&natiquement le genome du cyanophage S-2L 

- la figure 4 repr^sente sch&natiquement la difficulte potentielle du clonage 
de genes incorporant des bases D chez E.Coli. 



10 Des cyanophages S2L sont cultiv£s en masse k partir de Tespdce 

Synechococcus elongatus (8). L'ADN extrait est fragmente par sonication pour 
constituer une banque shotgun clonee dans un vecteur chez E. coli. Les clones sont 
sequences intensivement sur un s6quenceur jusqu'a couverture complete du genome. 
A mesure que des ORF sont £lucid6s comme homologues k des genes connus, 

15 il est proc&ie a leur expression chez E. coli ou chez Synechococcus, selon les 
fonctions supposees, notamment dans le but de valider les hypotheses fonctionnelles 
ou d'explorer les potentiality synthetiques. 

A cette fin, les interm£diaires supposes des voies de synthese (figure 2) ont 6t6 
synth6tis6s suivant les m&hodes courantes de la chimie des nucleosides et 

20 nuclueotides. lis sont syst&natiquement soumis a des extraits ou des melanges 
d'extraits de souches recombinantes exprimant chacune un gfene de S-2L, pour 
identifier les activites enzymatiques specifies par le phage. 

Plus pr£cisement, l'ADN du phage S-2L a ete prepare a partir de lysat de 
culture de Synechoccus. elongatus en adaptant les techniques utilises pour preparer 

25 l'ADN du phages. Cet ADN a et6 digerd par differentes enzymes de restriction dont 
Smal, ce qui a permis de verifier que le profil de restriction obtenu 6tait identique a 
celui decrit. Puis, on a montr6 que l'ADN de S-2L pent etre r6plique chez E. coli et 
sequence selon les protocoles standard, ce qui a conduit k construire une banque 
totale. Cette banque a 6t& construite par insertion de fragments d'ADN dig6r6 par 

3 0 Tenzyme CviJI (de taille comprise entre 3 et 5 kb) dans le plasmide pB AM dig6r6 par 
l'enzyme Smal et d6phosphoryl6. Apr£s Slectroporation de la souche d*E. coli 
DH10B, 400 clones ont 6t6 isotes et parmi ceux-ci 330 s6quenc6s (290 dans les deux 
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orientations, 40 dans F orientation + ou -) au Genoscope France. Les lectures ont 6t6 
assemblies en un seul contig de 44,16 kb dont la composition en bases est conforme 
a celle de l'ADN du phage, c'est-a-dire 69,3 % G:C et 30,7% A:T (a la place de D:T). 
L'ensemble des ORFs deduites de ce contig a et6 compare aux diffSrentes banques de 
5 donnees, ce qui a permis d f annoter tout parliculterement 54 d'entre elles representees 
sur le tableau 1 et tout particulierement 14 d'entre elles (en ne tenant compte que des 
homologies statistiquement significatives avec des prolines bact&iennes ou 
phagiques connues) mentionnSes « trfes significatives » sur le tableau 1. 



PROTEINE 


Nombre aa 


Cadre 


Position 


Trfes 
significatives 


SEQIDn 0 etORF n° 


ATYM A r^nlieatinn chrnmfKOtnale 

initiateur de proline 


134 


_2 


661 - 1062 




14 


ADN Polymerase 


50 


1 


963-1112 


• 


18 


Pn1v!c£tiHp <ivntfia^p 


177 


-1 


1308-1838 




26 


Beta glucosidase 


135 


-1 


4698-5102 




68 


ADN helicase 


51 


2 


6280 - 6432 


X 


86 




203 


.3 


6806-7414 


X 


92 


Ribonucl6proteine 


100 


1 


8064-8363 




105 


ADN proline de liaison 


656 


-2 


8320-10287 




109 


ARN proteine de liaison 


92 


1 


10299-10574 




134 


Rdplicase 


55 


-1 


11052-11216 




142 


Putative RNA Pol IIIADN dirigee 
sous-unit6 large 


72 


3 


11237-11452 




143 


DNA topoisome"rase I 


186 


-1 


11613-12170 




148 


ADN proteine d'emballage 


448 


-2 


11956-13299 


X 


152 


Proline de capside 


109 


1 


13629-13955 




169 


Adenylosuccinate synthetase 


419 


-1 


14235-15491 


X 


175 


Putative transcriptase inverse 


113 


1 


15132-15470 




187 


Transposase 


65 


3 


16799-16993 




208 


Exodeoxyribonuclease VIII 


347 


-2 


17113-18153 


X 


211 


ADN helicase 


424 


3 


18962-20233 


X 


234 


DSARN Adenosine desaminase 


172 


3 


20237-20752 




246 


RRNA Adenine N-6 
mdthyltransferase 


63 


-2 


20671-20859 




250 


Proteine de virulence E 


738 


3 


20921-23134 


X 


257 


ARN Polymerase II sous-unite large 


69 


-1 


21444-21650 




264 


Putative ARNt endonuctease de 
clivage 


251 


-1 


23316-24068 




286 


Enzyme de restriction de type I (M 
proteine) 


60 


-1 


24072-24251 


X 


298 


Proteine d'enveloppe 


385 


3 


25685-26839 


X 


316 


Guanylyl cyclase 


111 


-1 


27183-27515 




332 


Uracyl-ADN glycosylase 


65 


-2 


28063-28257 




342 


N-6 aminoadenine-N 
mdthyltransfgrase 


74 


I 


28239-28550 




347 
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Inosine 5'monophosphate 
d6shydrogenase 


67 


-1 


28401-28601 




348 


Proteine de membrane 


377 


-1 


28617-29747 




351 


Polymerase 


94 


-3 


28871-29152 




355 


Transketolase 


82 


-1 


29751-29996 




364 


Ribulose biphosphate carboxylase 


61 


2 


29893-30075 




365 


Proline d'absorption de la queue 


860 


1 


30105-32684 




369 


ARN proline de liaison 


247 


2 


30118-30858 




370 


ADN Pol HI sous-unite gamma 


103 


-2 


31876-32184 




380 


X proline de la queue M 


159 


1 


32889-33365 




392 


X proteine de la queue L 


509 


3 


33023-34549 


X 


395 


X proteine de la queue K 


271 


2 


30118-30858 


X 


406 


ARN Pol beta (fragment) 


84 


3 


35267-35518 




418 


X proteine de la queue I 


236 


2 


35458-36165 




422 


X protdine de la queue J 


1456 


1 


35598-39965 


X 


425 


ADN topoisomerase I 


79 


2 


36169-36405 




429 


DSdoxyadenine methylase 


74 


-3 


36428-36649 




432 


ARN Polymerase II sous-unite large 


146 


2 


36646-37083 




433 


ADN Polymerase I 


63 


-3 


39089-39277 




454 


ADN gyrase sous-unite B 


101 


3 


39989-40291 




464 


Dioxygenase 


301 


-2 


40156-41058 




466 


ARN guanylyltransferase 


190 


1 


41097-41666 




472 


Lysozyme 


381 


3 


41951-43093 


X 


484 


ARN proteine de liaison 


129 


-2 


42457-42843 




489 


Tranposase/exonuciease 


110 


3 


43097-43426 




494 


Phosphodiesterase 


58 


-2 


43417-43590 




500 



II s'agit notamment des proteines intervenant dans la formation et l'assemblage 
de la queue du bacteriophage X : proteine de la queue MLKI et J, de la proteine GP17 
5 qui joue un r61e dans le packaging de l'ADN dans le bacteriophage T4, d'une 
exonuclease qui pourrait intervenir dans l'exclusion de la base A, dune RNA 
h61icase, d'un facteur sigma et dune succinyladenylate synthetase. 

I/identification de genes codant pour un facteur sigma et une helicase 
conduisent k conclure que la transcription du genome de S-2L et la replication de 
10 l'ADN du cyanophage requierent vraisemblablement des proteines sp6cifiques cod6es 
par le phage et dont l'activite pourrait dependre de la base D. 

D'autre part, il semble tres vraisemblable que la base D soit form6e par 
modification h6mir6plicative. Entre les deux voies de biosynthese de formation de 
dDTP d6crites ci-dessus, Identification d'un homologue du gene de la 
15 succinyladenylate synth6tase appetee ddbA (pour d6soxyribodiaminopurine 
biosynthetic gene A) conduisent h conclure que c f est la deuxieme voie qui est 
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vraisemblablement empruntee lors de l'infection phagique (figure 2). 
Plusieurs tests ont ete effectues dans le but de determiner Tactivite de la proline 
correspondante. Les resultats sugg£rent que l'expression de ddbA permet de restaurer 
la croissance d'une souche d'i£ coli exprimant le g£ne yaaG de Bacillus subtilis en 
5 presence d f une concentration elevee de dG (lOmM). D'autre part, la 2,6- 
diaminopurine devient toxique (lOmM) pour E. coli lorsqu'elle est sous forme 
phosphoryiee (ce qui a ete teste dans la mdme souche d'E. coli exprimant le gene 
yaaG de Bacillus subtilis soit MG1655 pSU yaaG) ce qui permet d'avoir un crible 
pour identifier in vivo la voie complete de biosynthdse de la base D. 

10 Toutefois Identification complete n'est pas n6cessaire pour obtenir dbs k 

present des bases D par les procedes decrits precedemment. 

Une autre approche consiste a exprimer systematiquement les ORF specifiant 
tous les genes possibles de S-2L et a combiner les activites brutes resultant de cette 
expression pour faire apparaitre in vitro les metabolites de la voie. Une voie 

15 m6tabolique inductible produisant le dDTP sera ensuite 6difiee chez E. coli par 
assemblage des g&ies appropries. La voie ainsi edifice sera appliqu6e k des 
precurseurs syntMtiques pour g6nerer des nucleotides deviants par la base et le sucre. 

L'utilisation de la base D dans les processus de replication et de transcription 
est systematiquement recherchee dans les extraits des bact£ries exprimant les ORF 

20 phagiques. 

Les resultats ci-dessus ont ete obtenus a l'aide des travaux suivants. Le gene 
ddbA a ete exprime chez E. coli sous le contrdle d'un promoteur inductible et 
plusieurs tests ont ete effectues dans le but de determiner l'activite de la proteine 
correspondante. Les resultats obtenus montrent que l'expression de ddbA permet de 

25 restaurer la croissance d'E. coli en presence d'une concentration 61evee de dGMP. 
D'autre part, la 2,6-diaminopurine devient toxique pour E. coli lorsqu ! elle est sous 
forme phosphoryiee ce qui devrait permettre d f avoir un crible pour identifier in vivo 
la voie complete de biosynthese de la base D. Le g£ne ddbA a ete amplifie en 
utilisant 100 pmol de chaque oligonucleotide ngaattcaagctttcagcgacggtagcgggcatac et 

30 nnnnccatggtgaagaactgcaacctgatc, lOOng d'ADN de S-2L comme ADN matrice, 
200mM de chaque dNTPs, 10 ml de tampon Pfu polymerase 10 fois concentre, 
DMSO 10% et 5U Pfu polymerase. Les cycles d f amplification etaient : une etape de 
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10 min a 95°C, puis 25 cycles 95°C 30 sec, 56°C 30 sec, 72°C 2 min 20 sec puis une 
<§tape de 1 0 min a 72°C. Le produit ^amplification a ensuite ete purifte a l'aide du Kit 
Jetsorb (Genomed GmbH) puis digere par les enzymes de restriction Ncol et HindTT T . 
Aprfes purification, le produit d'amplification a et6 ins6r6 dans le plasmide pBAD24 
5 (Guzman et al., 1995 J Bacteriol 177:4121-4130) dig&6 par les memes enzymes de 
restriction. Le g6ne ddbA est dans cette construction exprimS a partir du promoteur 
de l'operon araBAD qui est inductible par rarabinose. 

La banque de cyanophage S2L est maintenue dans la souche d'RColi U2033 
depos^e le 24 Janvier 2001 k la Collection Nationale de Cultures de Microorganismes, 
10 Institut Pasteur, 25 rue du Dr Roux, 75724 PARIS Cedex 15, France, selon les 
provisions du traite de Budapest, et a ete enregistree sous le numero d'ordre 1-2619. 

Grace aux travaux realises par les inventeurs, le sequencage du genome de S- 
2L permet d'alterer, d'inhiber ou de diversifier la synthese des acides nucleiques in 
vitro et in vivo. 



15 
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REVENDICATIONS 

1. Sequence nucleotidique de cyanophage S-2L caracterisee en ce qu'elle 
correspond a SEQ ID N° 1. 

5 

2. Sequence nucleotidique de cyanophage S-2L, caracterisee en ce qu'elle est 
choisie parmi : 

a) une sequence nucleotidique comportant au moins 80 % d'identite avec 
SEQIDN 0 1; 

10 b) une sequence nucleotidique hybridant dans des conditions de forte 

stringence avec SEQ ID N° 1 ; 
c) une sequence nucleotidique complementaire de SEQ ID 

N° 1 ou complementaire d'une sequence nucleotidique telle que definie 

en a), ou b), ou une sequence nucleotidique de TARN correspondant ; 
15 d) une sequence nucleotidique de fragment representatif de SEQ ID N° 1, 

ou de fragment repr£sentatif d'une sequence nucleotidique telle que 

definie en a), b) ou c); 
e) une sequence nucleotidique comprenant une sequence telle que definie 

en a), b), c) ou d) ; et 

20 f) une sequence nucleotidique modifiee d'une sequence nucleotidique telle 

que definie en a), b), c), d) ou e). 

3. Sequence nucleotidique selon la revendication 2, caracterisee en ce qu'elle 
code pour un polypeptide choisi parmi : 

25 a) les polypeptides du cyanophage S-2L de sequences SEQ ID N°2 a SEQ ID 
N°527 ; 

b) de preference les polypeptides de sequence SEQ ID 

N°14,18,26,68,86,92,105 5 109,134,142,143,148,152,169,175 ? 187, 208,211, 
234,246, 250,257,264,286,298,316,332,342,347,348,351,355,364,365, 
30 369,370,392,395, 406, 418,422,425,429,432,433,454,464,466,472, 

484,489,494,500 ; 

c) de preference encore les polypeptides de sequence SEQ ID N° 86,92,152,175, 
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234,257,298,316,395,406,425,484; 

d) les polypeptides pr6sentant au moins 80 % de preference 85 %, 90 %, 95 % et 

98 % d'identite avec un polypeptide de a), b) ,c) 

e) les fragments biologiquement actifs des polypeptides de a), b), c), d) 
5 f) les polypeptides modifies de a),b),c),d),e). 

4. Sequence nucleotidique caracterisee en ce qu'elle comprend une sequence 
nucleotidique choisie parmi : 

a) une sequence nucleotidique selon la revendication 3 ; 
10 b) une sequence nucleotidique comportant au moins 80 % d'identite avec 

une sequence nucleotidique selon la revendication 3 ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte 
stringence avec une sequence nucleotidique selon la revendication 3 ; 

d) une sequence nucleotidique compiementaire ou d' AKN correspondant a . 
15 une sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique de fragment representatif d'une sequence 
telle que definie en a), b), c) ou d) ; et 

f) une sequence nucleotidique modifiee d'une sequence telle que definie en 
a), b), c), d) ou e). 



20 



5. Polypeptide code par une sequence nucleotidique selon Tune des 
revendications 2 a 4. 



6. Polypeptide selon la revendication 5, caracterise en ce qu'il est choisi parmi les 
2 5 peptides de sequence SEQ ID N°2 & 527, de preference parmi les sequences 

SEQIDN o 14,18^6,68,86,92,105,109,134,142,143,148,152, 169,175,187, 
208,21 1,234,246,250,257,264,286,298,3 16,332,342,347,348, 
351,355,364,365,369,370,392,395,406,418,422,425,429,432,433,454,464, 
466,472,484,489,494,500. 

30 

7. Polypeptide selon la revendication 5 ou 6, caracterise en ce qu'il est choisi 
paimi les sequences SEQ ID N° 86,92,152,175,234^5738,316,395,406,425, 
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8. Polypeptide caracterise en ce qu'il comprend un polypeptide choisi parmi : 
5 a) un polypeptide selon Tune des revendications 5 k 7 ; 

b) un polypeptide pr&entant au moins 80 % d'identite avec un 
polypeptide selon Tune des revendications 5 a 7 ; 

c) un fragment d'au moins 5 acides amines d'un polypeptide selon 
Tune des revendications 5 k 7, ou tel que defini en b) ; 

10 d) un fragment biologiquement actif d'un polypeptide selon Tune des 

revendications 5 a 7, ou tel que defini en b) ou c) ; et 
e) un polypeptide modifie d'un polypeptide selon Tune des 
revendications 5 a 7 ou tel que defini en b), c) ou d). 

15 9. Sequence nucleotidique selon Tune des revendications 2 a 4, caracterisee en 

ce qu'elle code pour un polypeptide de cyanophage S-2L implique dans la 
biosynthese des nucleotides, des purines, des pyrimidines ou nucleosides ou 
pour Tun de ses fragments representatifs. 



20 10. S6quence nucleotidique selon Tune des revendications 2 k 4, caracterisee en 

ce qu'elle code pour un polypeptide de cyanophage S-2L implique dans la 
biosynthese de bases D ou pour Tun de ses fragments representatifs. 

11. Sequence nucleotidique selon la revendication 10, caracterisee en ce qu'elle 
25 code pour un peptide de sequence SEQ ID N°175. 

12. Sequence nucleotidique selon Tune des revendications 2 a 4, caracterisee en 
ce qu'elle code pour un polypeptide de Cyanophage S-2L implique dans le 
processus de replication, ou pour Tun de ses fragments representatifs, de 

30 preference un peptide de sequence SEQ ID N°14,18,142,355,429,454 

(activite ADN polymerase, topoisomerase). 
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13. Sequence nucleotidique selon Tune des revendications 2 & 4, caracterisee en 
ce qu'elle code pour un polypeptide de Cyanophage S-2L implique dans le 
processus de transcription ou pour Tun de ses fragments representatifs, de 
preference un peptide de sequence SEQ ID N°92,143,187,234 encore de 

5 preference SEQ ID N°92. 

14. Sequence nucleotidique selon Tune des revendications 2 a 4, caracterisee en 
ce qu'elle code pour un polypeptide d'enveloppe de Cyanophage S-2L ou 
Tun de ses fragments representatifs, de preference un peptide de sequence 

10 SEQ ID N°169,316,351,392,395,406,422,425, notamment un peptide de 

sequence SEQ ID N°395,406,425. 

15. Sequence nucleotidique selon Tune des revendications 2 a 4, caracterisee en 
ce qu'elle code pour un polypeptide de Cyanophage S-2L implique dans le 

15 detournement de la machinerie cellulaire ou 1'un de ses fragments 

representatifs. 

16. Sequence nucleotidique selon 1'une des revendications 2 k 4, caracterisee en 
ce qu'elle code pour un polypeptide de Cyanophage S-2L implique dans la 

20 virulence ou Tun de ses fragments representatifs, de preference un peptide de 

sequence SEQ ID N°257. 

17. Polypeptide selon 1'une des revendications 5 a 8, caracterise en ce qu'il s'agit 
d'un polypeptide de Cyanophage S-2L implique dans la biosynthese des 

2 5 nucleotides, des purines, des pyrimidines ou nucleosides. 

1 8. Polypeptide selon 1'une des revendications 5 a 8, caracterise en ce qu'il s'agit 
d'un polypeptide de Cyanophage S-2L implique dans la biosynthdse de bases 
D, de preference un peptide de sequence SEQ ID N°175 ou un fragment 

30 representatif. 

19. Polypeptide selon 1'une des revendications 5 & 8, caracterise en ce qu'il s'agit 
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d'un polypeptide de Cyanophage S-2L implique dans le processus de 
replication, de preference un peptide de sequence SEQ ID 
N°14,18,142,355,429,454 ou un fragment repr<§sentatif. 

20. Polypeptide selon Tune des revendications 5 & 8, caracterise en ce qu'il s'agit 
d'un polypeptide de Cyanophage S-2L implique dans le processus de 
transcription, de preference un peptide de sequence SEQ ID N°92,143,187 
ou un fragment repr6sentatif . 

21. Polypeptide selon Tune des revendications 5 & 8, caracterise en ce qu'il s'agit 
d'un polypeptide d'enveloppe de Cyanophage S-2L, de preference un 
peptide de sequence SEQ ID N° 169,316,35 1,392,395,406,422,425 ou un 
fragment representatif. 

22. Polypeptide selon l'une des revendications 5 a 8, caracterise en ce qu'il s'agit 
d'un polypeptide de Cyanophage S-2L implique dans le m&abolisme 
intermediate, ou un fragment repr6sentatif. 

23. Polypeptide selon l'une des revendications 5 a 8, caracterise en ce qu'il s'agit 
d'un polypeptide de Cyanophage S-2L implique dans le processus de 
detournement de la machinerie cellulaire ou 1'un de ses fragments. 

24. Puce a ADN ou filtre, caract6ris6e en ce qu'elle contient au moins une 
sequence nucieotidique selon Tune quelconque des revendications 2 a 4. 

25. Vecteur de clonage, et/ou d'expression, caracterise en ce qu'il contient une 
sequence nucieotidique selon l'une des revendications k 3 ou 4 ou 9 k 16. 

26. Vecteur de clonage, et/ou d' expression selon la revendication 25, caracterise en 
ce qu'il contient une sequence nucieotidique selon la revendication 10 ou 11, 
en particulier codant pour une proteine impliquee dans la synthase de bases D. 
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27. Vecteur de clonage, et/ou d' expression selon la revendication 25, caract&ise en 
ce qu'il contient une sequence nucleotidique selon la revendication 11 ou 12, 
en particulier codant pour une polymerase capable de polym£riser des bases D. 

28. Cellule hote, caract6ris6e en ce qu'elle est transformee par un vecteur selon 
Tune des revendications 25 a 27. 

29. Cellule h6te selon la revendication 28, caract6ris<§e en ce qu'il s'agit d'une 
bacterie. 

30. Proced£ de preparation d'un polypeptide d'int&et, caracterisS en ce que Ton 
cultive une cellule transformee par un vecteur selon Tune des revendications 
25 a 27 dans des conditions permettant l'expression dudit polypeptide et que 
Ton recupere ledit polypeptide recombinant. 

31. Proc6d6 selon la revendication 30, caracteris<5 en ce que le polypeptide 
d'interet est une proline impliquSe dans le m6tabolisme de bases D, 
notamment la succinyladenylate synthetase. 

32. Procede selon la revendication, caract&ise en ce que le polypeptide d'interet 
est une polymerase de cyanophages S-2L, capable de polym&iser des bases D. 

33. Polypeptide recombinant susceptible d'Stre obtenu par un proced6 selon la 
revendication 30. 

34. Anticorps monoclonal ou polyclonal, ses fragments, ou anticorps chimerique, 
caract6ris6 en ce qu'il est capable de reconnaitre specifiquement un 
polypeptide selon Tune des revendications 5 k 8 ou 17 k 23. 

35. Anticorps selon la revendication 34, caract6ris6 en ce qu'il s'agit d'un 
anticorps marqu6. 
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36. Puce k proline, caracterisee en ce qu'elle contient au moins un polypeptide 
selon l'une des revendications 5 a 8 ou 17 a 23, ou au moins un anticorps 
selon Tune des revendications 34 ou 35, immobilise sur le support de ladite 
puce. 

5 

37. Proc6d<§ de detection et/ou d' identification du cyanophage S-2L ou d'un 
phage associe dans un echantillon biologique, caracteris^ en ce qu'il met en 
oeuvre une sequence nucl6otidique selon Tune des revendications 3 a 4 ou 9 & 
16. 

10 

38. Procede d'obtention de bases D et/ou de polynucleotides d'int6ret comprenant 
au moins une base D, comportant la culture d'un microorganisme comprenant 
au moins une sequence nucleotidique de cyanophage S-2L codante pour au 
moins un polypeptide implique dans la synthese de bases D, dans des 

15 conditions approprtees pour le developpement du vecteur et la synthese de 

bases D et/ou dedits polynucleotides d'int&§t. 

39. Procede selon la revendication 38 comportant : 

l'addition a un milieu comprenant les substrats n6cessaires k l'obtention 
20 de bases D, d'un extrait ou un melange d'extrait de bacteries 

recombinantes exprimant au moins un gene de cyanophage S-2L 
implique dans la synthese de bases D 
le cas 6ch£ant l'extraction des polynucleotides d'interSt. 

25 40. Procede selon la revendication 38 comportant : 

- la preparation d'au moins une sequence ADN codante pour un 
polypeptide capable de provoquer chez un microorganisme hote la 
synthese d'au moins une base D 

- le clonage de ladite sequence codante dans un vecteur capable d'etre 
30 tranf6r6 dans et de se repliquer dans ledit microorganisme hote, ce vecteur 

comprenant les elements n6cessaires a 1'expression de ladite sequence 
codante 



WO 03/093461 



52 



'CT/FR03/01328 



- le transfert du vecteur comprenant ladite sequence codante dans un 
microorganisme capable de prodviire les enzymes de la synthase de bases 
D dirig^e par ladite sequence codante 

la culture du microorganisme dans des conditions appropriees pour le 
5 developpement du vecteur et la synthase des bases D 

- le cas 6cheant 1' extraction de bases D et/ou dedits polynucleotides 
d'int&ret. 



41. Proc6de d'obtention de bases D et/ou de polynucleotides d'interSt comprenant au 
10 moins une base D ledit procede comportant : 

- l'addition, a un milieu comprenant les substrats n^cessaires k Fobtention 
de bases D, du produit d'expression d'au moins un gene de cyanophage S- 
2L implique dans la synthese de bases D, de manure a produire des bases 
D et/ou des polynucleotides d'interet comprenant au moins une base D 
15 - l'extraction des bases D et/ou dedits polynucleotides d'interet 



42. Procede d'obtention de polynucleotides d'interet comprenant au moins une base 
D, ledit procede comprenant la culture d'un microorganisme contenant au moins 
une sequence nucleotidique de cyanophage S-2L codante pour au moins un 
20 polypeptide implique dans Felongation desdits polynucleotides avec 

incorporation de bases D, ADN polymerase notamment, dans des conditions 
appropriees pour le developpement du vecteur et V Elongation desdits 
polynucleotides. 

25 43. Precede selon Tune quelconque des revendications 38 k 42 caracteris6 en ce que 
le gene implique dans la synthase de bases D est le gfene de la succinylad6nylate 
synthetase. 



44. Procede selon Tune quelconque des revendications 38 k 42 caracteris6 en ce qu'il 
30 comprend une etape d 5 amplification, en presence de polymerase de cyanophage 

D et d' amorces appropriees, de polynucleotides comprenant au moins une base 
D. 
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45. Procede de selection de composes capables de stimuler ou d'inhiber la synthese 
de bases D et/ou de polynucleotides d'interet comprenant au moins vine base D, 
comprenant Taddition au milieu de synthase du compost teste et la comparaison de 
la synthese en presence et en absence dudit compost. 

5 

46. Utilisation du cyanophage S-2L pour Tobtention d'ADN polymerase ou d'ARN 
polymerase impliquees dans le metabolisme des bases D. 

47. Utilisation du cyanophage S-2L pour la fabrication de nucleotides d'intSret non 
1 0 obtenus naturellement comprenant au moins une base D, dDMP et dDTP. 

48. Souche de Cyanophage S-2L depos^e a la CNCM n° 1-2619 caracterisee en ce 
qu'elle contient au moins une sequence nucieotidique selon la revendication 1 a 4, 

15 49. Procede de production d'une banque genomique de cyanophage S2L caracterisee en 
ce que le procede comprend les etapes suivantes : 

a) Culture des cyanophages S2L purifie a partir de Tespece Synechococcus, 

b) Fragmentation de V ADN extrait par la technique de sonication, 

c) Clonage de la banque Shotgun obtenue dans un vecteur E.coli, et 
20 d) Sequen9age des clones jusqu'i couverture complete du genome. 

50. Banque genomique de cyanophage S2L deposee le 24 janvier 2001 k la C.N.C.M. 
selon les provisions du traite de Budapest, et enregistrees sous le numero d 5 accession I- 
2619 obtenue par un procede selon la revendication 49. 

25 

51. Plasmides contenus dans des bacteries recombinantes depos6es h la C.N.C.M. sous 
la reference 1-2619. 

52. Bacteries recombinantes telles que deposees k la C.N.C.M. sous la reference 
30 1-2619. 
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Figure 2b 
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Figure 3 
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